1-1 機械翻訳の現在と未来:機械翻訳が新たに生み出すサービスは何か?

2016/01/15

パネリスト:

栄藤 稔 Etoh Minoru

201512161023_4-150x0.jpg
株式会社みらい翻訳 代表取締役社長
 3年毎にやることが変わる技術屋。並列計算機、デジタルVCR、人工知能、パターン認識研究に携わり、2000年よりNTTドコモでモバイルマルチメディア担当。2005年に分散音声認識を商用化。2012年、データマイニング技術蓄積を応用し「しゃべってコンシェル」を実用化。現在、NTTドコモ執行役員とみらい翻訳社長を兼務、機械翻訳の実用化に情熱を燃やす。

隅田 英一郎 Sumita Eiichiro

201512161023_5-150x0.jpg

国立研究開発法人情報通信研究機構 ユニバーサルコミュニケーション研究所 副所長
30年以上翻訳に携わる技術屋。IBM、ATR、NICTで一貫して機械翻訳を研究、規則翻訳・用例翻訳・統計翻訳の全手法を熟知。2010年公開の音声翻訳アプリ「VoiceTra」、2014年開始のカスタマイズ可能なテキスト翻訳サイト「みんなの自動翻訳@TexTra」へ貢献。現在、音声翻訳の国家プロジェクト「グローバルコミュニケーション(GC)計画」を推進、イノベーションの兆しが見えた機械翻訳に情熱を燃やす。
 
モデレーター:

古谷 祐一 Furuya Yuichi

201512161023_6-150x0.jpg

GMOスピード翻訳株式会社 代表取締役社長、JTF理事
 見積→翻訳者アサイン→納品の全プロセスを自動化、低コスト・短納期化を実現した「オンライン翻訳サービス」を手掛ける。ISO27001(情報セキュリティマネジメントシステム)取得、機密性の高い翻訳案件を安心して発注できる体制を確立。

報告者:山口 政隆

 


 
ビッグデータ活用の「統計翻訳」に代表される機械翻訳(MT)。現状性能や今後の進展、翻訳産業が今後とるべき道。「2020年までに言語の壁をなくす」GC計画へ参画中の両パネリストが講演。その後の質疑応答も活発だった。「MTは人手翻訳の仕事を奪う?」答えはNO。「翻訳メモリ・人手翻訳の必要性はむしろ増える。参加場所を広げるという理解を共有できれば」の言葉が印象的だった。

隅田氏講演

  • 今やコーパスに基づく統計翻訳が圧倒的に高性能。コーパス量の増大、DNN(深層ニューラルネット)適用が功を奏し、国際技術コンペWAT2015では統計翻訳が従来方式を凌駕した。高精度自動翻訳技術は、今後5~10年は性能改善し続けると考える。
  • 課題も多く、MT基礎研究はまだ続く。「同時通訳、意味・文脈の細かい解釈」で人手翻訳は求められ続けるだろう。
  • 翻訳産業がとるべき道は、自動翻訳との「共進化」:英語⇔ハングルなどMT対応困難とされる言語間でも、品質を問わず、自動翻訳を道具として使う世界的な潮流。プレ/ポスト編集を含め翻訳者の仕事は増えるだろう。
  • 「国立翻訳バンク」構想:企業・自治体から多分野の対訳コーパス寄付を募り(5億文/年)汎用の自動翻訳精度向上を実現したい。

栄藤氏講演

  • NTT、SYSTRAN、NICTの言語処理技術を集積、NTTドコモのクラウド管理基準、AWS(Amazon Web Services)を活用した多言語音声翻訳プラットフォームを構築した。以下3つの翻訳マーケットを見据え、「人・機械ハイブリッド」「性能向上」による新領域に注力していく。
  • 多言語コミュニケーション:公共団体や企業
  • ビッグデータ:国防・警察・法律
  • ローカライゼーション:翻訳会社・グローバル企業
  • 自社の多言語データをアセット(有用な資産)と思うことが大切。

ディスカッション(質疑応答・抜粋)

Q「Google翻訳はどのレベルに達していると感じているか?」
栄藤「どの観点で見るかによる(論文翻訳はよいが、他はそうでもない等)翻訳サービス提供=洋服をオーダーメイドで仕立てるようなものと考えている」
隅田「栄藤氏の回答の通り。Google翻訳は製品としては1種類。精度が上がらないので、現状のままであれば徐々に使われなくなるのでは」「包丁にもいろいろある。1つの包丁ではなく、目的にあった包丁を使わないと美味しい料理は出来ません」
 
Q「国立翻訳バンクの仕組みはいつ頃実現?何を準備すれば良い?」
隅田「2020年までには完成させたい。地方公共団体、量販店等からデータはすでに受領している。準備としては、コーパスは捨てずに電子データとして残しておいてほしい。また上層部の理解を得ることも大切」
 
Q「BLEUスコアを上げたいクライアントが提供すべきコーパス量の基準はあるか?」
栄藤「よい質問。“弊社の10万件で翻訳精度はどの程度上がる?”とヨーロッパではよく聞かれるが、日本では数値基準が出るほどまだ事例が集まっていない」
隅田「分野(ドメイン)に依存する。IT系マニュアルは少なくても良く、特許は多く必要」
栄藤「金融や製薬など高い守秘レベルが求められる業界からのコーパス提供は一般的に難しい。」