Interview:「グローバルコミュニケーション計画」の取組状況

2016/03/04

Interviewee

荻原 直彦

総務省 情報通信国際戦略局
技術政策課 研究推進室長

平成4年郵政省(現 総務省)入省。以来、情報通信行政に携わり、平成21年より情報流通行政局 衛星・地域放送課 地域放送推進室 技術企画官、平成22年より総合通信基盤局電波部 電波政策課 電波利用料企画室長。平成25年より現職となり、多言語音声翻訳システムの研究開発と社会実装を目標とする「グローバルコミュニケーション計画」を推進している。

 



聞き手 ● 河野 弘毅(日本翻訳ジャーナル)
取 材 ● 2015年11月
報告者 ● 目次 由美子(LOGOStar)

 



 2020年に東京で開催されることとなったオリンピックとパラリンピックへ向けて、訪日観光客のみならず、日本国内の地域社会に居住する外国人の増加に伴い、グローバルなコミュニケーションの支援が高まっている。このような状況において、総務省は2014年4月に世界の「言葉の壁」をなくし、グローバルで自由な交流を実現することをミッションとした「グローバルコミュニケーション計画」を発表した。機械翻訳の波が押し寄せる最中、この動きを牽引するともいえる計画の最新状況について、総務省の担当者に直接インタビューをする機会を得ることができた。

はじめに

 荻原氏は音声翻訳の研究が始められたのは1980年代後半であり、世に知られるようになったのは2007年の後半であると紹介してくれた。2007年に総合科学技術会議(現 総合科学技術・イノベーション会議)で音声翻訳のデモをしたことはニュースなどにも取り上げられた。スマートフォンが普及しておらず、パソコンなどで実現されたシステムは、使い勝手の観点からその当時はすぐに普及にはつながらなかった。
 スマートフォンの普及、通信事業者による音声対話や翻訳アプリの実現なども経て、2020年オリンピックへ向けて「外国人が日本に来たときに困らないために」と音声翻訳技術の本格的な社会実装への取り組みが進められている。

グローバルコミュニケーション計画の概要

 グローバルコミュニケーション計画には、「世界の『言葉の壁』をなくす」というミッションが掲げられている。
 
このミッションには、以下の3つのビジョンが伴う。
(1)多言語音声翻訳システムの利用による「グローバルで自由な交流の実現」、(2)多言語音声翻訳システムの社会実装および活用をもたらすパイオニアとしての「日本のプレゼンス向上」、(3)世界から集まる選手や観客を対象とし、言葉の壁を感じさせることのない「東京オリンピック・パラリンピックでの『おもてなし』」。
 この計画の核を成す「多言語音声翻訳システム」は、国立研究開発法人である情報通信研究機構(NationalInstitute of Information and Communications Technology: NICT)で開発されている。たとえば、NICTは「VoiceTra」(ボイストラ)という名前のスマートフォン向けアプリを無償で提供している。多言語音声翻訳システムは、(1)音声認識、(2)多言語翻訳、(3)音声合成という3つの技術で構成されており、日本語を音声入力すると、直ちに外国語に翻訳し、音声出力される。
 
 2015年10月にはグローバルコミュニケーション計画に基づき、NICT の従来の研究成果を反映させた最新版のVoiceTra が公開された。ユーザビリティが考慮されユーザー インターフェースが刷新されたばかりではなく、翻訳精度も著しい向上を遂げ、また、世界で初めてミャンマー語の音声認識・音声合成にも対応した。29言語に対応し、10言語における旅行会話は実用レベルに達しているそうだ。
 
荻原:翻訳の精度を高めるためにはコーパスが必要とされています。要するにデータベースです。たとえば、「日本語の音声認識コーパス」については、聞こえ方の異なる「車」というデータをどれだけ多く集められるか、「対訳コーパス」については、日英の対訳データをどれだけ多く集められるか、これが翻訳精度の決定に関わってきます。
※ コーパス: 自然言語の文章を品詞など文の構造の注釈をつけて構造化したものを大規模に集積したもの
 
 そして「グローバルコミュニケーション計画」が策定され、2020年オリンピックまでに社会実装するという目標の下、取り組みが進められている。

「グローバルコミュニケーション計画」の推進

 多言語音声翻訳技術では、旅行分野の会話だけでなく、特に医療やショッピング分野における会話の翻訳精度の向上に取り組む予定であるが、対応言語数や雑音対策、長文翻訳などの課題も抱えている。病院、商業施設、観光地などでの社会実証を展開していく予定である。
 
河野:日常会話全般を最終目的にしていますか?
荻原:旅行や医療の会話を中心に取り組んでいる中で、一般的な日常会話も自然な展開として翻訳精度が上がっていくと考えています。
 
 たとえば、成田空港ではターミナル内の巡回案内スタッフがタブレットを利用してフライト情報や施設情報などを案内している。これにはNICT の技術が活用された多言語音声翻訳アプリ「NariTra」が活用され、アジア地域からの来客に対応している。
 2015年2月に開催された「東京マラソン2015」では、約3万6千人の参加ランナーのうち、約5千人は外国人ランナーだったとのこと。ランナーやその家族に対する給水・給食、手荷物管理などを行う約1万人のボランティアスタッフに「VoiceTra」を活用してもらったそうだ。このような実験的利用において、周囲の雑音により音声認識が芳しくなかったなどの課題が示されたと同時に、外国人との会話における利便性も挙げられ、期待の高さも明らかとなった。東京都や関係機関とも連携し、さらに多言語音声翻訳システムの社会実装へ向けての取り組みが続けられていくこととなっている。
 
 この他にも、「2015東京国際ユース(U-14)サッカー大会」の選手交流会や、「2015ジュニアスポーツアジア交流大会(バドミントン・卓球)」に参加する海外チームと都内学校との交流会でも実験的利用により、専門用語や年齢層に依存する話題の拡充、スマートフォンを操作するために作業を中断する必要性など、取り組むべき新たな課題も認識された。
 2015年8月、東京メトロでは訪日外国人との円滑なコミュニケーションを支援するツールとして導入され、岡山県警では外国人旅行者に対する道案内や遺失物に関する対応の支援として「VoiceTra」の試験利用が開始されたなど、音声翻訳技術の活用の幅広さが伺える。今後、フィードバックを受けてさらなる改善へとつなげる予定であるとのこと。
 また、民間企業との共同研究も進んでおり、アナウンスにおける音声技術やロボットなどの先進技術との融合により、さらなる効果が期待されている。
 
荻原:グローバルコミュニケーション計画において大きく掲げてはいませんが、「防災分野」も重要であることを認識しています。
 
 音声認識技術においては、人の声は認識されても、テレビの音声やスピーカーを介したアナウンスの声は認識されないことがある。アナウンスにおける技術の発展は、防災分野での技術展開が期待されている。
 
 2015年4月には首相官邸で開催された総合科学技術・イノベーション会議において進化した「 VoiceTra 」のデモを実施し、2020年オリンピック・パラリンピック東京大会へ向けて端末の形状や翻訳精度のさらなる向上について言及した。
 また、内閣府による「2020年オリンピック・パラリンピック東京大会に向けた科学技術イノベーションの取組に関するタスクフォース」と連携した総務省の研究開発も進められている。このタスクフォースでは、「海外からの来訪者などに多様なサービスを提供するための意志・情報伝達サポートの実現」や、「『サイバーフィジカルシステム』による安全・安心の実現および快適な『おもてなし』の実現」など、9つのプロジェクトが検討されている。

研究体制の強化

 グローバルコミュニケーション計画を推進するにあたり、NICT 内には「先進的音声翻訳研究開発推進センター」(Advanced Speech Translation Research and Development Promotion Center: ASTREC)が設立され、民間企業から約20名の研究者を迎えた。
 さらに、グローバルコミュニケーション開発推進協議会も設立され、NICT を中心に産学官の力を結集して、多言語音声翻訳技術の精度を高め、さまざまなアプリケーションに成果を適用して社会展開していくための検討を行っている。協議会には音声翻訳に関連する大学・研究機関ばかりではなく、医療、交通、観光など関連性が強く伺える分野、その他の各種メーカーや翻訳に携わる企業など、2015年10月現在で128機関がすでに参加している。

将来の社会実装に向けて

 音声翻訳で今日抱えている課題の克服のみならず、現実的な理想イメージが掲げられている。たとえばショッピングの分野では、見栄えも考慮し、店員が所持する端末のデザイン性への配慮なども挙げられている。
 
荻原:たとえば緊急医療でも、機械翻訳を使うのに適した場面としては想像しにくいかもしれませんが、頭が痛いのかお腹が痛いのかを把握するだけでも大きな違いをもたらすことがあると考えられます。
 
 クリティカルな場面では通訳者に接続するためのHELP ボタンの搭載など、実社会での現実的な利用を見据えた目標が示されており、音声翻訳システムと人による翻訳・通訳との棲み分けも考慮されていることが伺える。
 タクシー業界などでは運転中にヘッドセットを装着したり、スマートフォンの操作は不可能であり、カーナビと組み合わせた端末の必要性など、協議会でさらに改善へつながる課題を集積する予定とのこと。

翻訳業界に及ぼす影響

河野:翻訳業界では機械翻訳の発展が目覚ましいという現状があります。グローバルコミュニケーション計画の一部として、音声翻訳への取組以外に、テキスト翻訳へ発展させる予定はありますか?
荻原 : NICT では特許文書なども含め、テキスト翻訳にも取り組んでいます。ただし、旅行会話のためなどとは異なるコーパスを収集する必要が発生します。音声翻訳への取組と並行して進めていく予定です。
 
河野:私企業の事業とは異なると思いますが、世界戦略についてお考えはお持ちですか?たとえば、2015年10月末のアプリのダウンロード数を見るとVoiceTra は約14万、一方、Google 翻訳は約400万ですが?
荻原:日本語を取り扱う翻訳という点では優れた技術であると思っています。表現豊かな日本語特有の言い回しなども含め、日本国内の利用者からの要請にはさらに迅速に対応する枠組みをつくっていきたいと考えています。
 
河野:グローバルコミュニケーション計画が翻訳業界に影響を及ぼすようなことは考えられますか?たとえば、シンポジウムやセミナーを通じて、協議会の参加企業が機械翻訳の利用を促進するような機会がもたらされるでしょうか? NICT に限定せず、機械翻訳の技術を活用している翻訳支援ツールはありますが。
荻原 :協議会の参加企業にも、同様のシステムを活用している企業はあります。また、協議会の次の活動では、会員企業の情報交換会を計画しています。翻訳技術を活用する様々なテクノロジーを見せ合うというところでしょうか。グローバルコミュニケーション計画を推進することにより、NICT の翻訳技術が多方面で活用されることを望んでいます。

 


総務省 情報通信国際戦略局について

情報通信技術(Information & Communications Technology: ICT)を経済の成長・競争における重要な源ととらえ、グローバルな視点での総合的および戦略的な政策を展開する上で、研究開発、標準化活動、国際展開活動などを一体的に推進しています。