オリンピックに向けた自動通訳の国家プロジェクト

2016/03/04

セミナー報告

立教大学 異文化コミュニケーション学部主催
連続講演会「通訳翻訳と異文化コミュニケーション」
第4回講演会

 

隅田英一郎氏

国立研究開発法人 情報通信研究機構
ユニバーサルコミュニケーション研究所 多言語翻訳研究室長
 30年以上、翻訳をやっている技術屋。IBM、ATR、NICTと三段跳びしながらも、一貫して機械翻訳を研究してきた。規則翻訳、用例翻訳、統計翻訳の全ての手法を熟知している。高精度の自動翻訳技術を創出し、74件の特許、230件の論文を公開した。ATR以降は音声翻訳にも注力し2010年に公開した音声翻訳のアプリVoiceTra、2014年に開始したカスタマイズできるテキスト翻訳のサイト「みんなの自動翻訳@TexTra」に貢献した。現在、音声翻訳の国プロ「グローバルコミュニケーション計画」を推進しながら、イノベーションの兆しが見えた機械翻訳にメラメラと情熱を燃やす。

 



日時●2015年11月7日(土)13:30~15:00
開催場所●立教大学池袋キャンパス マキムホール
報告者●目次由美子(LOGOStar)
 



立教大学の異文化コミュニケーション学部では、2015年度に計5回の連続講演会を開催し、異言語・異文化のコミュニケーションにおいて通訳翻訳行為が果たす役割や課題に対し、専門領域の視点から理解を深めることに取り組んでいる。第4回の講演では「2020年のオリンピック・パラリンピックは自動通訳国家プロジェクトの檜舞台」という題目が掲げられ、増加し続ける訪日外国人に対する言語サービスを支えるテクノロジーの最新状況について知識を深め、テクノロジー開発における異言語・異文化コミュニケーションの課題について議論する機会となった。
日本を訪れる外国人旅行者の増加によりもたらされる経済成長について、2020年に東京で開催されるオリンピックとパラリンピックへ向けての楽観的な希望を含めた展望が囁かれている。しかしながら、「言語の壁」はその障壁ともなることが紹介された。たとえば外国人旅行者を迎える旅館には、外国語での対応に不安を抱く傾向が伺えるそうだ。機械翻訳の支援により「言語の壁」を打ち破ることができれば、観光産業はさらに活性化され、日本経済の成長の一躍を担うこととなるであろう。
アジアからの訪日外国人の多さも紹介され、特にタイからの訪日旅行者の近年での伸び率は著しいそうだ。そして、アジアの要として成長を遂げているミャンマーについても言及があった。ミャンマーは、約14億人を抱える中国、約13億人のインド、約6億人のアセアンのほぼ中心域に所在しており、経済成長における重要な地域として期待されている。アジア言語対策の重要性が認識されている。
 
観光産業ではインバウンドばかりでなく、アウトバウンドでの機会も伺える。医療技術の展開や新幹線などの開発においては、日本語も英語も通じない地域への専門技術者の海外赴任の需要があるという。ここでも「言葉の壁」は立ちはだかっている。
音声翻訳の研究が開始されたのは1986年だという。隅田氏は1992年に実施された史上初めてのデモの動画を一部見せてくれた。当初、1行の処理には1分を要したそうだ。2014年には総務省により「グローバルコミュニケーション計画」が策定された。当時の新藤義孝総務大臣は隅田氏が勤務する情報通信研究開発機構(National Institute of Information and Communications Technology: NICT)を訪問したとのこと。2020年までには音声翻訳システムを社会で実装するようにとの目標が掲げられた。
グローバルコミュニケーション計画は総務省による推進の下、NICTを中心として「オールジャパン」の体制で取り組みが進められている。「先進的音声翻訳研究開発推進センター」(Advanced Speech Translation Research and Development Promotion Center: ASTREC)がNICT内に新設され、民間企業から約20名の研究者を迎えた。また、「グローバルコミュニケーション開発推進協議会」も設立され、音声翻訳を社会展開していくための検討や実験的な利用を進めている。音声翻訳に関連する大学および研究機関のみならず、音声翻訳との関連性が強く伺える分野の関連企業や団体、その他の各種メーカーや翻訳に携わる企業など、2015年10月にはすでに128機関が参加している。
隅田氏はNICTがリリースした「VoiceTra」という名前の自動翻訳アプリを実演してくれた。実際に隅田氏の携帯端末をプロジェクターに投映し、隅田氏自身の発言をVoiceTraでいくつかへの言語へ翻訳した。VoiceTraは29言語に対応した音声翻訳アプリである。NICTの研究の一環であり、無償でサービス提供しているとのこと。翻訳結果に誤りがあった場合などにはレポートを送信するための機能も装備されており、使い方のコツを紹介する動画もウェブサイトで公開されている(http://voicetra.nict.go.jp/vt/picture.html)。
音声翻訳は、(1) 音声認識、(2) 機械翻訳、(3) 音声合成という3つの技術が融合されており、コーパスに基づく統計翻訳により圧倒的に優れた性能を実現しているとのこと。コーパスとは、簡単にはデータベースと言うこともできるが、自然言語の文章に品詞など文の構造の注釈を付与して構造化したものを大きく集積している。NICTではコーパス収集にも尽力しており、2003年には約20万文であったが、2015年には約3億文を蓄積したとのこと。


熱心な参加者からは質問も多く寄せられた。世界的に有名な大規模のオンライン機械翻訳システムに話が及ぶと、NICTは「日本人が適正に使えるシステムを作る」ことに尽力しているとのことで、「万能包丁で刺身を切るのではない」と表現されていた。
自動翻訳の精度が向上することにより翻訳の速度は上がり、文字単位での翻訳単価は低下することが予想される。しかしながら、これによって翻訳の需要が大きくなることが見込まれるというのだ。翻訳が必要とされるテキストの分量は増え、新たな分野でも翻訳の需要が発生し、高度な翻訳が一層大切にされるであろうとのこと。このためにも、コーパスの共有、汎用自動翻訳の創出など、さらなる課題が言及された。
しかしながら、2020年以降の機械翻訳の社会実装については課題も抱えている。同時通訳特有の難しさや、文脈の研究の必要性も提示された。また、昨今では機械翻訳が統合して使用される翻訳支援ツールにも言及があり、自動翻訳システムと翻訳者の共生については「花と蜜蜂のような関係」と表現されていた。
)でもNICTの機械翻訳技術を体験できる。ユーザーが対訳文や用語を自由に追加し、自動翻訳のエンジンを成長させるといった取り組みであり、「特許やマニュアルなど長文を正確に翻訳するための新技術の研究」に基づくものだ。隅田氏は、この5~10年で性能改善が停滞することはないだろうと考えており、さらなる性能の向上が期待できる。https://mt-auto-minhon-mlt.ucri.jgn-x.jp/また、「みんなの自動翻訳」というウェブサイト(VoiceTraの翻訳性能はTOEIC(Test of English for International Communication)で600点を取得する日本人に相当すると言われている。実際に、さまざまなTOEICスコアを有する人間の音声翻訳能力と比較を実施し、最終的に英語のネイティブスピーカーによる判断を経て評価されている。翻訳の専門家からは、より高いTOEICスコアに相当する性能が必要であるとの指摘も受けているそうだが、NICTでは2020年にはどこででも使えるようにという目標も掲げ、VoiceTraのさらなる改善に邁進している。