イベント報告

2020/03/13

2019年度第3回JTF関西セミナー
製薬業界におけるAI翻訳の現状と将来性
 



テーマ製薬業界におけるAI翻訳の現状と将来性
内山 将夫 Uchiyama Masao 国立研究開発法人情報通信研究機構(NICT) 上席研究員
木下 潔 Kinoshita Kiyoshi MSD株式会社 グローバル研究開発本部 非臨床担当マネージャー
津山 逸 Tsuyama Nogaru フリーランス翻訳者
早川 威士 Hayakawa Takeshi 株式会社アスカコーポレーション R&D部
隅田 英一郎 Sumita Eiichiro アジア太平洋機械翻訳協会(AAMT)会長
石岡 映子 Ihioka Eiko JTF関西委員長)

 


 

2020年2月26日に開催予定だったセミナーが4月以降に延期された。読者のTODOリストに追加していただくことを目論んで、準備万端だったセミナーのコンテンツの一部をジャーナルのページを拝借しご紹介したい。

MT開発者の内山将夫氏、製薬会社から木下潔氏、フリーランス翻訳者の津山逸氏、翻訳会社から早川威士氏に、ここ数年で驚異的な高精度を達成しているAI翻訳に関わる話題をご提供いただく。

AIの進展は急速で、AIが囲碁のトップ棋士を破るなどの衝撃的な事件だけでなく、AIは自動運転をはじめ生活に関わる様々な分野に浸透し始めている。ほかならぬ翻訳についても、AI翻訳が人間の翻訳者を凌駕したという話が出る一方で、AI翻訳は「もっともらしい誤訳をする扱いにくいシステムだ」と非難する声も絶えない。
ただ、確実に、これなら使えるかもしれない、というレベルに近づいている。

まず、開発の現場から内山将夫氏(国立研究開発法人情報通信研究機構:NICT 上席研究員)から「アダプテーションによる製薬専門NMTの研究開発」についてお話しいただく。
 

NICTで公開している「みんなの自動翻訳@TexTra」には、「汎用NT」という、汎用的なテキスト翻訳のための自動翻訳エンジンがある。この自動翻訳エンジンの精度は、「翻訳バンク」への皆さまのご協力により、製薬分野を含めて、一般テキストに対する翻訳精度が高くなった。

汎用的な自動翻訳エンジンに加えて、みんなの自動翻訳では、アダプテーションといって、特定分野の対訳データを学習することにより、その分野での翻訳性能を格段に向上することが可能である。

一般には非公開であるが「製薬NT」はその手法を適用したものであり、汎用NTと比べて、翻訳精度の自動評価値であるBLEUの値が10以上高い。「BLEUが10以上高い」場合には、通常、人手評価においても明らかな品質の向上がある。製薬NTの開発では、大量の高品質な対訳データでアダプテーションできたことが、このような大きな品質の向上につながった。これは、自動翻訳技術を持つNICTのシーズが、大量の高品質対訳データを保有し、かつ、高品質製薬自動翻訳を必要とする製薬業界のニーズに、非常にうまくマッチしたといえる。

今後、製薬自動翻訳をさらに高精度化するために自動翻訳アルゴリズムを向上し、また、継続して対訳データを自動翻訳エンジンに投入するとともに、このような成功例を多分野に展開することが、有望かつ必要であろう。

次にクライアントの現場から、木下潔氏(MSD株式会社グローバル研究開発本部 非臨床担当マネージャー)に製薬会社での「翻訳作業」とAI翻訳への期待について。


製薬会社には、クスリについての最新情報を、全世界の医療施設や当局に提供し続けることが求められている。日本で情報を提供するためには、世界言語である英語と日本語との翻訳作業を避けて通ることはできない。平常ではこの作業を翻訳会社に依頼することもできるが、急を要する翻訳作業は内製せざるを得ず、限られたリソースでの対応に苦慮しているのが現実である。

数年前に出現したニューラル機械翻訳(いわゆるAI翻訳)は、今日では翻訳作業の「素訳」として活用できるレベルにまで達している。AI翻訳の精度は、AIのアルゴリズム(AI翻訳エンジン)の最適化に加え、対訳データ(学習させる日英対訳コーパス)の量と質により決まるとされている。このため昨年、製薬業界で使用される文書の日英対訳コーパスを大量に学習させることで、より実用性の高い翻訳文を生成できる「製薬系AI翻訳エンジン」開発に向けての共同研究が行われた。

このような製薬業界に特化したAI翻訳エンジンは、業界に即した翻訳文を速やかに生成できるため、便利で実用性の高い翻訳サポートツールとして極めて有用である。このサポートツールの性能を継続的に高めることの出来る仕組みを構築し、いつでも活用できる環境を整えることは、製薬関連文書の翻訳に関わる方々はもちろん、製薬業界および医療に関わるすべての方々にとっても大きなメリットになると考えられる。


その後、医薬専門のフリーランス翻訳者である津山逸氏に「翻訳者によるMT後の後編集のさじ加減」について実例を紹介しながらお話しいただく。


NICTと、大量の文書を「正確に高速で」翻訳する必要性に迫られている製薬業界、両者が協働することで、医学翻訳の実務に耐える高性能の分野特化型MTエンジンが実現しつつある。各社が保有する膨大な対訳データ(約3,200,000対)がコーパス化されて、NICTのニューラルMTに組み込まれたわけである。

この試験運用中「製薬MT」の性能評価に参画するという好機に恵まれた。NICTの「みんなの自動翻訳@TexTra®」を利用して「製薬MT」の出力(英日と日英)を得て、通常の人間翻訳と同等の品質になるように後編集(ポストエディット)を行なった。原文の情報を正確に伝えるという点では、精度の高い訳文が出力されていた。とりわけ、専門用語の選択は的確で、コーパスが非常に良く効いていると思われる。程よい後編集について考える。

最後に翻訳会社の立場から、早川威士氏(株式会社アスカコーポレーション R&D部)が
「AI翻訳を取り入れた翻訳ワークフローの設計」について。


機械翻訳(MT)技術はAIを取り入れたことにより着実に進歩を続けているが、果たしてMTは人間の翻訳の代わりになるのだろうか?ならないとすれば、MTには何が欠けているのだろうか?ポストエディット(後編集)が困難なのは、翻訳という仕事とMTが行うテキスト変換との間にある不足分を、それが実際には何なのか可視化されていないまま引き受けざるを得ない点にあると考える。その問題点にアプローチしないまま、強引にMTを導入しても、あるいは逆にMTを切り捨てても、いま抱えている翻訳に関わる課題の解決にはつながらないだろう。

このような状況で必要なのは、翻訳に求められていることを改めて見つめ直し、MTやポストエディットが協調的に機能できるようなワークフローを設計することであると考える。MTにできることは何なのか、人間がやらなければいけないことは何なのか、それぞれの役割を可視化し、機能として最適化されたプロセスを作ることが課題解決の道になるだろう。併せて、解決すべき課題の基盤となるユーザーのニーズを理解してワークフローの目的を明確化するために、翻訳の品質やコストモデルについても考察することも欠かせない。

最適なワークフローを作るためには試行錯誤が必要であり、事例の蓄積と共有、さらにはその研究と分析を業界を挙げて推進していくことが望ましい。進化するAI翻訳が力を発揮し、ポストエディットの生産性が向上することによって、翻訳というビジネスに新たな可能性が生まれることを期待したい。

最後に、4氏の発表を受けて、「三方良しのAI翻訳実用化~製薬翻訳を題材に~」というタイトルでパネルを行う。モデレータは隅田英一郎氏(アジア太平洋機械翻訳協会会長)である。
 

クライアントの発注をうけて翻訳者・翻訳会社が納品するまでの翻訳プロセスにAI翻訳を入れることは単純ではないし、AI翻訳の効果も支配的というわけでもない。実際に高精度のAI翻訳を作った人間、それを製薬会社、翻訳者、翻訳会社と異なる立場で使った4氏の生の声を同時に聴ける機会は滅多にない。どう使うのがいいのか、可能なのか、参加者からの事前質問への回答なども含め、会場とインタラクティブなやり取りを取り入れるつもりである。

昨年3月の関西セミナーの続編として是非楽しみにしてほしい。この1年での進化がわかるはずである。開催日時が決まり次第広く告知するので、是非、このセミナーをライブでお楽しみいただきたい。