イベント報告

2020/05/08

2019年度第5回JTF翻訳セミナー報告
通信社と放送局が開発するニュース翻訳MT最前線

中澤 敏明 Nakazawa Toshiaki


山田 一郎 Yamada Ichiro



田中 英輝 Tanaka Hideki



津田 明 Tsuda Akira



朝賀 英裕 Asaka Hidehiro


 


2019年度第5回JTF翻訳セミナー報告
日時●2020年2月4日(水)14:00 ~ 16:40
開催場所●自動車会館
テーマ●通信社と放送局が開発するニュース翻訳MT最前線
登壇者●順不同
中澤 敏明 Nakazawa Toshiaki 東京大学 大学院情報理工学系研究科 特任講師
山田 一郎 Yamada Ichiro NHK 放送技術研究所スマートプロダクション研究部 上級研究員
田中 英輝 Tanaka Hideki NHKエンジニアリングシステム システム技術部 上級研究員
津田 明 Tsuda Akira 時事通信社 編集局英文部長
朝賀 英裕 Asaka Hidehiro 時事通信社 東京五輪パラリンピック対策室統括マネジャー
報告者●伊藤 祥(翻訳者/ライター)

 



 正確さ、わかりやすさ、スピードが命のニュース報道の世界で、日本で主たる役割を担っているのが通信社、新聞社、テレビ局である。日々刻々どこでどんなことが起こるか分からない、そんなニュースを追いかけ、取材された記事は、ニーズに応じ日本語から英語へ、さらにはその他の言語へと翻訳される。また外国から配信されるニュースが日本語の記事に翻訳されることもある。いずれも正確かつ迅速でわかりやすいことが求められる。
 機械翻訳の技術応用が難しい分野といわれるニュース翻訳の分野でもMTの研究が進められている。本セミナーでは業界のなかでも中心的な存在の時事通信社とNHK、そしてMT開発研究のフロントランナーである東京大学の3つの組織から、ニュース翻訳MTの分野で最前線を走る5人が、現在の取り組みや課題について熱く語り、難しい取り組みの起点をリアルタイムで知る、重要な機会となった。

第1部 機械翻訳を理解するための基礎知識

東京大学 大学院情報理工学系研究科 特任講師 中澤敏明

機械翻訳の精度

 近年、機械翻訳の進歩は目覚ましく、機械翻訳の精度は人間並みになったと言われることもある。しかし、これは「ある言語のあるドメインに限っては」であるのに、そこだけ取り出して語ると誤解が生じる。
 アジア言語を対象とした機械翻訳精度のワークショップWAT(Workshop on Asian Translation)では、毎年機械翻訳の評価を行っている。2015年まではSMT(統計的機械翻訳)。2016年からはNMT(ニューラル機械翻訳)のRNN(リカレントニューラルネットワーク)型、2018年からはTF(トランスフォーマー)型と変遷してきた。2016年のNMTの登場以来、翻訳精度が大幅に向上し、流暢さが増した。仏英のWikipediaや新聞の翻訳ではすでに人間並みとなっており、科学技術論文や特許でも90%近い精度となっているとされる。
 ところが実際の使用感としてはそこまで良いと思えない。その理由は論文のための実験や、各社の翻訳エンジンの広告などでは、良く見える部分のデータを使っている。つまり、良い結果のものは、論文の著者や各社が用意した限られた評価データであったりして、一般的にどんな文でもうまくいくとは限らない。例えば、評価データには長い文は含まれないことが多く、100単語以内がほとんどである。特許の長文など適さないものを機械翻訳するのは、機械翻訳関係者に言わせれば、使い方が間違っているということになるのだ。

機械翻訳手法の比較

 機械翻訳の歴史は1950年代ぐらいまでさかのぼるが、特に直近では1993年からのSMTの20年の歴史を、NMTが数年で大きく上回る進歩を見せた。
コーパスベースの機械翻訳は、訓練に対訳コーパスを学習させるが、データ量が多いと機械翻訳の精度も上がると言われている最も大切なものである。必要なデータ量は、翻訳するものの種類や求める品質による。例えば旅行対話であれば表現が限られているので、特許やニュースよりは少なくて済むといった具合である。最近は対訳コーパスを用いないNMTの研究もあるがまだ精度はよくない。
 SMTという機械翻訳はたくさん候補を出し、入力文を全てカバーする組み合わせを探す翻訳であった。小さな部分ごとに目的言語に置き換え、全ての部分が置き換えられたら翻訳終了となる。

NMTの特徴

 NMTは、ベクトルと行列の掛け合わせで出来た、全て数字の世界の翻訳である。ニューロンと呼ばれるのは神経細胞の情報伝達を模した数学モデルだからである。各ニューロンへの入力は一つの実数値で、ニューロンの出力の集合がベクトルとなる。ニューロンに値が入力される際にはそれぞれ重みがかけられ、この重みは行列として表現される。この計算を何回も繰り返し、最終的に出力されるベクトルを正解と比較して、正解と近い出力が得られるよう重みを調整する「訓練」が行われている。
 単語をニューラルネットーワークに入力する際には、まず単語をベクトルに変換する必要がある。この作業はEmbeddingと呼ばれ、これによりKing-man+woman≒queenのように意味らしきものが学習されるのだ。
 NMTはSNTに比べ前処理·後処理が不要でシンプルな工程である。NMTの中で、RNNは一つ一つの単語を読みこんでベクトル化し、最後に一文全体のベクトルを作成する。そのプロセスをまた何度か反芻するようなプロセスを経て、最終的な訳文を作成するのだが、いつ終わるかコントロールできない弱点がある。訳抜けや過剰訳が起こることもある。対訳コーパスを使っての訓練とは、出力文の単語を一つ出すたびに正解文の単語と比較し同じ単語が出せるように重みを調整するが、訓練に使う文は最大100単語までなどの制限をすることが多い。この制限以上の長さの文を訳させると精度が落ちたり、翻訳できなかったりする。TF型になって、Self Attentionと言う仕組みを取り入れることで、文内の遠い位置にある単語との関係を直接捉えることが可能になったと同時に、入力文を解析する部分の計算を並列処理して計算することができるようになり、ネットワーク全体の計算効率が非常に高くなり、訓練スピードが上がった。
 NMTは入力文を置き換えることで翻訳するのではなく入力文を見ながら翻訳文を作り出すため流暢である。しかし、入力文を過不足なくカバーすることができない。Embeddingのベクトル化で柔軟な翻訳は可能となったが、地名などでは別の地名が似たようなベクトルとなってしまうことがあり、全然違う訳が出ることがある。NMTでは1単語出力するごとに、次に出力する単語を判断するために入力文のどこに注目するかを計算しているが、その注目結果は必ずしも翻訳文と入力文の一々の単語対応を表しているわけではない。しかも、現在は計算量のキャパのために使える語彙サイズを制限することが多く、一般的に5万語程度とすることが多い。そのため専門用語や低頻度語に弱い。

翻訳と機械翻訳の今後について

 機械翻訳は使い方次第では現在も実用的と言えるので、翻訳者は可能な限り生出力データを使用し、文体調の修正はしない前提のライトポストエディットなどは取り組むとよいと思うが、フルポストエディットは困難ではないかと考えている。翻訳エンジンの作成はいまや学生にもできるレベルで参入障壁が低い。企業にとって大事なのはデータでありデータとエンジンを使いこなせるエンジニアがいることで製品化することは容易である。利用者はある程度のNMTの知識を持って使用することが必要だ。今後NMTの翻訳性能が上がる余地は大いにあるけれども、機械翻訳は人間の翻訳とまだまだイコールではないので、翻訳者の仕事がなくなることはない。一方、異なるレベルの多様なニーズは確かに存在するので、ロングテールをどう取り込んでいくかが大事だと思う。翻訳者も新しいポストエディットに手を出してみてもよいのではないか。

第2部 ニュース翻訳 MT 開発着手の理由

時事通信社 東京五輪パラリンピック対策室統括マネジャー 朝賀英裕

実務の観点からの評価
~ 通信社にとってニュース翻訳の重要性とプロセス / MT 開発に着手した理由 /現在の問題点 文脈、固有名詞、新語、数字、日付 ~

 通信社とは取材した内容を記事にし編集して、新聞社・官公庁・個人など多岐にわたるクライアントに配信している企業である。 
時事通信社が大切にしているのは「速報」「実務情報」「国際性」の3つで、実務情報とは株価などビジネスに必要な情報を指す。また、なぜ国際性かと言うと、日本の日本新聞協会に属する新聞社·放送局は、103の新聞社、22の放送局であり地方局地方紙が中心だ。各社地域に根を張り地域の目線に立った報道活動している。 しかしながら、地方の媒体でも大ニュースであれば他の県、地方、国々の情報を報道しなければならない。だが、そのために多大な人的金銭的リソースを使うわけにいかないので、他の国のニュースは通信社への要請が高く、みんなで通信社の費用を負担している。通信社は自社の取材網に加え、国際通信社と提携して情報を配信している。
 このような通信社における翻訳ワークフローは、日英翻訳においては、まず日本語の記事を出稿し、その中から選択、下訳を行う。下訳は新人などが行うことも多いが、その後ネイティブチェックで英語の妥当性をチェック、校正はスタイルにも英語にも記事作成にも熟練したスタッフが行う。事実関係や固有名詞のチェックも行わなければならない。例えば、社長という役職をどう英語で表すかは社によって異なるのでそれもチェックする。完璧を求める業界なのでとても厳しい。一本の所要時間は2-3時間程度である。
 通信社が配信している新聞社と放送局向けのニュース記事は1日約600本、写真を加えると日本語でトータル1日1000本ぐらいある。一方外電の入電は記事、写真を合わせると1日1万本近くにのぼる。これらのニュースを、完全な自動翻訳とはいかなくてもワークフローの改善を行うことで、多言語発信に新たな可能性を求めたいと考え、時事通信社はNICT(情報通信研究機構)の委託研究「多言語音声翻訳高度化のためのディープラーニング技術の研究開発」に参画した。これは、東京工業大学、東京大学、愛媛大学、日本放送協会、NHKエンジニアリングシステム、時事通信社の6社共同の研究で、2018年から20年度の3年間で ①インテリジェント翻訳技術 ②ニュース対応翻訳技術(ニュース·写真) ③マルチモーダル ④社会実装の研究を進めるものだ。
 この研究における時事通信の役割は、まず、研究にあたってはデータが大事ということで、通信社の記事は日本語の完成度が高く、記事数も多いことから、研究用データの提供を行った。そして、実務への活用を目指し、社会貢献につなげるべく、実務のワークフローを提案し、実際に現場の人が使えるかの観点で主観的にそれを評価し、結果を研究にフィードバックすることである。
 現状の実力は、中澤先生のお話にもあったように、WATの2019年度の評価で2017年以降投稿されたすべてのMT翻訳システム中での1位を獲得、特許の日英英日翻訳でも高い評価となった。しかし、ニュース翻訳に特化したMTの開発が実務で使えるかの観点の評価のため、現場で試用した意見をまとめてみると、「固有名詞·日付·曜日·数字の問題さえ何とかなれば使える」ということだが、現状では技術的に難しいとのことなので、そこのクリアが待たれる。
 また、ニュース翻訳とはわかりやすく伝えるため、ニュースバリューのある点のみ伝えるために、大きく人間の手で編集されるものなので、その対応は機械には難しいと感じている。

パネルディスカッション
 

NHK 放送技術研究所スマートプロダクション研究部 上級研究員 山田一郎

放送局における機械翻訳利用の現状

 NHKの国際放送、NHK WORLD JAPANは外国で受信する人のための国際放送で、オンデマンドのラジオで17カ国語、ネットで18カ国語配信し、放送でも2ヶ国語のニュースを流している。そして、ネットでは試験的に機械翻訳で英語のライブストリーミングに7ヶ国語で翻訳エンジンを用い、字幕を付与している。これは2019年6月より4ヶ月の予定であったが好評で延長している。
 一方で放送局では人手による翻訳作業も実施している。その制作過程では、時事通信社のニュース制作過程と同様、日本語のニュースから英語への翻訳を行い、複数回の修正を経てテレビ·ラジオ·ネットで配信され、時間の要する作業となっている。
 この英語ニュース制作支援のために、ニュース翻訳システムの研究開発を着手したばかりだ。ニュースは一文の文字数が長く、話し言葉で、独特な言い回しがある。訓練データの条件は、翻訳したい文と類似していること、データ量が多いこと、しかし対訳の品質は満たされておらず、片方の言語にデータが多い。そのため、日本語ニュースを人手で翻訳したり、バックトランスレーションしたものをニューラルネットで学習させた。
 その結果を現場で一か月試験利用した評価は、好意的な評価もあったが厳しい意見が多かった。翻訳精度は記事内容で差があり、例えば文例が少ないものや、スポーツのインタビュー原稿などでは話が定まらないので、翻訳が支離滅裂となった。固有名詞や数値、日付が不正確、訳抜けする、事実関係が異なるなどの現象が発生した。「文の構成を変更しなくてはならないなど、機械翻訳にかけることで逆に作業が煩雑になる」との声もあった。また、秒速を時速に変換してほしい、円ドル換算してほしい、穴だらけのものを穴だらけのまま訳してほしい、わからないならあいまいに訳してほしいなど、機械にやってほしいことの要望も出た。
 今は「可能性を検討し始めた」という段階で、実際の翻訳にはまだ厳しい。現場ではなかなか機械翻訳システムに対する抵抗があり使われないという難しさもあるが、これから、使ってもらうことで精度を上げていきたい。

 

NHK エンジニアリングシステム システム技術部 上級研究員 田中英輝

通信社と放送局が開発するニュース翻訳MT最前線
~ 機械翻訳から見た時事通信社ニュースの特徴 / 学習データ作成の工夫と様々な試み ~

 日英の機械翻訳システムの開発のために使う学習データが備えていてほしい性質は「日本語と英語が一対一で対応していること」、「大量であること」、作成コストが「安価であること」である。時事通信社の実際の翻訳原稿に一致し、このような性質を持つ対訳コーパスを日々の業務で構築できるとよい。
 対訳コーパス開発の言語資源として、2011年10月から2018年6月までの日本語記事1,561,143本、日英対応記事57,154本分提供していただいた。
 まず、日英対応記事の類似度調査のため、英語ニュース554記事を忠実に日本語に翻訳し、元の日本語記事と翻訳の類似度を比較したところ、平均類似度は0.79と高かった。類似度の高い記事をさらに調査したところ、文レベルの対応は必ずしも取れないことが分かった。記事の内容は同じだが情報、すなわち文の提示順序が変化している場合があった。また、ほぼ文単位で対応している場合でも日英の情報に差が見られることもあった。類似度が中程度の記事では文単位で補足されているところやカットされているところが出現し、日本語のみに存在する文や英語のみに存在する文があるという状況であった。
 前述のことから日英対応記事をそのまま対訳コーパスとして使うことは難しいので、学習データ作成には工夫と様々な試みを行っている。現在、日英対応記事から対応する文を東京大学の中澤先生が作成した「文アライメントプログラム」で抽出する手法、未翻訳の日本語記事を人手で翻訳する手法、日英対応記事の日本語記事を英語に合わせて人手で修正する手法の3手法でデータを作成している。「文アライメントプログラム」は、日英対応記事から、あらかじめ設定した類似度以上で対応する文を自動抽出する機能を持つ。類似度を高く設定するとデータが減り、低く設定すると対応精度が下がるので設定値を決めるのが難しい。現在は類似度0.3に設定している。
 これらの対訳コーパスで学習させた翻訳エンジンで、基本的な翻訳実験をしてみると、大意はほぼ理解できるがやはり日付·固有名詞に問題が出ることが確認できた。
今後は、現在の3手法でのデータ作成を進めて翻訳性能の変化を確認した後、データ作成に機械翻訳結果のポストエディットを利用することも検討したい。 

 

時事通信社 編集局英文部長 津田明

読者の違いに応じた編集
~ ニュース翻訳の特徴 / 現状のMT出力の評価 ~

 英文記事作成の現場においては、読者の違いに応じた編集を念頭に置いている。日本語の記事では読者は日本人で日本の事情に通じているが、英語の記事では読者は外国人で日本の制度や習慣、歴史などに詳しくないことを想定している。
 そのため例えば北方領土問題や皇室に関する記事など、日本独特の内容を含む記事には過不足ない補足説明を追加している。ニュースの編集には限られた時間しかないので、簡潔に組み立て直し、それによって読者の理解を助け、読みやすい記事の作成に努めている。
 これはプロのセンスやスピード、判断力が必要で腕が問われるものとなっている。場合によっては構成も変わることがあるので、translationというよりはtrans-creationだと考えている。
 このような高いスキルの要求にMTがどこまで対応できるのか?現状ではプロの英訳水準としては正直なところ物足りない。下訳としては使えるかもしれない。いずれにせよ、まだ人間の翻訳レベルには及ばないと感じている。ただ、AIの学習力は侮れない。インプットを蓄積していけば経験値が上がり、将来プロの水準の再現もあるのではと注目している。
 我々も機械に負けないよう研鑽を積んでいきたい。

質疑応答

Q: 機械翻訳の誤訳·訳抜けがなくなるのはいつ頃になりそうか?
A: 使う場所によって、求められるレベルは異なるので、ニーズによっては今でも要求を満たしているものはある。機械翻訳モデルの中だけで完全に解決するには、ニュースレベルとなれば発展のスピードによるが10年はかかると思う。ただ前処理後処理で何とかするという方法があると思うのだがやる人がいないところが問題だ。

Q: 翻訳を行う記事の社内でのパーセンテージ、優先順位の分野は?
A: 日英セット記事は3-5パーセントぐらいである。30年前は海外ニュースは海外通信社の情報しかなかったが、今は情報があふれているので待って訳する必要もないし、支局の記事で事足りるケースも多くなったので、ニーズは下がっている。ビジネスが成り立つかということを判断基準に、経済情報や自治体向け情報などに取り込みたい。