7. データを使った翻訳を成功させる方法:河野弘毅(株式会社翻訳センター)

2015/07/03

データを使った翻訳を成功させる方法


 

株式会社翻訳センター 河野弘毅
 

 
クライアントの立場から見た翻訳サービス
要求が異なる二種類の翻訳があり、アウトバウンド翻訳(他者に読んでもらう翻訳)は人力翻訳で、インバウンド翻訳(自分が読むための翻訳)では機械翻訳が多くなっている。しかし、このような状況は少しずつシフトしつつあり、翻訳会社でもクライアントに機械翻訳を提供する場面もある。
 
変化していく翻訳供給(TextMindedの事例)
同じ顧客ポータルから翻訳者にも、クラウド翻訳にも、機械翻訳にも発注をすることが可能になる。こうしたサービスを提供する翻訳会社が既に存在しており、これが翻訳会社の将来像になっていくのではないだろうか。
 
翻訳で利用される“データ”=言語資産
Glossary/Terminology=用語集
TM=Translation Memory 翻訳メモリ
MT=Machine Translation 機械翻訳
 
TMSにおける翻訳データの利用例(2014.9)
TMS= Translation Management System 翻訳管理システム
Tradosは自分のデスクトップにインストールし、翻訳したものはローカル上にあったが、TMSはクラウド上にサイトがあり、翻訳会社も翻訳者もそこにアクセス、翻訳したものはサーバーに同期される。
TMSで用語集が利用された割合は、38%、4割程度に留まっている。翻訳メモリは71.2%使用されており、用語集よりも翻訳メモリが使われている。機械翻訳は、使ってない53%、使っている47%で、現在は逆転していると考えられる。機械翻訳は1位マイクロソフト、2位Googleのシェアが圧倒的である。
 
データを使った翻訳を成功させるには?
大量かつ高品質の言語資産・優れた工学技術(エンジン改良)・上手な言語資産運用の三つの要素がある。
 
大量かつ高品質の言語資産
対言語コーパスはウェブ上にあまり存在しないため、いかにして質の良い対言語コーパスを集めることが重要になってくる。翻訳業界は大まかに顧客企業、翻訳会社、通翻訳者で構成され、この中で対言語コーパスの生産、集積、活用を行うことになる。
翻訳を作るのは通翻訳者であり、初期のTradosのようなデスクトップ型の翻訳支援ツールを導入した場合、通翻訳者によって対言語コーパスの生産を行われる。また、クラウド型の翻訳支援ツールを導入すれば、通翻訳者が生産した対言語コーパスを、通翻訳者だけでなく、翻訳会社の方で集積することも可能になる。さらに、顧客ポータルモデルさ導入されるようになると、発注側である顧客企業の方で対言語コーパスを活用することができると考えられる。この最終段階を目指して翻訳業界は変化している。
コーパスは、言語ペアと分野に依存する。分野を特定してそこでコーパスを集めた方が良い。少数の良い翻訳を集めた方が良い翻訳ができる。自分が必要な言語、分野に関してどれだけコーパスが集まっているか、ということが問題になる。翻訳会社のコーパス蓄積能力は、会社の規模に依らず、ある分野に特化したコーパスが作れる会社の方が有利になるかもしれない。
 
上手な言語資産運用
機械翻訳の運用における課題として、機械翻訳プロセス、ポストエディターの養成、ポストエディットの手法、コーパスの管理運用手法があげられる。機械翻訳プロセスに関して言うと、機械翻訳の導入はツールの採用ととらえるのではなく、新しいプロセスへの適応ととらえる必要があり、品質基準の再考から翻訳単価の見直しまで複雑な関連問題を検討しなければならない。さらに、翻訳対象テキストの知的財産権は顧客が所有しているため、コーパスとして利用できるか、ということも問題になる。
金融資産が優秀なファンドマネージャーのもとに集まるように、言語資産は優秀な言語資産運用者のもとに集まるように、今後の翻訳会社は言語資産をいかに上手に使いこなして顧客の利益をもたらせるか、の競争になる。
 
近い将来における翻訳会社の役割
機械翻訳には言語資産(用語集・翻訳メモリ・コーパス)が必要であり、これは人力翻訳から取り込まれる。この言語資産の作成過程に翻訳会社が携わる。すなわち翻訳会社は言語資産を管理する役割を担う。