2-4 いまさら聞けない機械翻訳 ~動作原理から上手な活用方法まで~

2015/01/16

パネリスト:

秋元 圭 Akimoto Kei

201501141548_5.jpg
獨協大学大学院外国語学研究科博士前期課程修了。2003年から2014年6月まで(株)クロスランゲージ、(株)クロスランゲージアールアンドディにて機械翻訳エンジンの開発を行う。2012年11月よりAAMT機械翻訳課題調査委員会委員。

内山 将夫 Uchiyama Masao

201501141548_6.jpg
独立行政法人情報通信研究機構 主任研究員。(独)情報通信研究機構(NICT)で自動翻訳の研究開発に従事。翻訳者支援サイト「みんなの翻訳」と、カスタマイズできる自動翻訳サイト「みんなの自動翻訳@TexTra®」を研究・開発。

山田 優 Yamada Masaru

201501141548_7.jpg
株式会社翻訳ラボ代表、麗澤大学、青山学院大学など講師。IT、ローカリゼーション実務翻訳者、プロジェクトマネージャーを経て、現在は主に大学で翻訳通訳を研究する。

モデレーター:

井佐原 均 Isahara Hitoshi

201501141548_8.jpg
豊橋技術科学大学情報メディア基盤センター センター長・教授。AAMT理事。
通商産業省工業技術院電子技術総合研究所、郵政省通信総合研究所を経て、現職。AAMT前会長、機械翻訳国際連盟元会長。言語資源協会理事。
企画協力:
アジア太平洋機械翻訳協会(AAMT)

報告者:二木 夢子(英日・日英翻訳者)

 



本セッションでは、翻訳業務で機械翻訳を効果的に利用するための知識やノウハウを3つの観点から解説した。

ポストエディット(PE)(山田氏)

まず山田氏がPEに関する研究を発表した。PEとは、機械翻訳の結果を後から手作業で修正することで、欧米言語同士では、コストと納期とのバランスでみると通常翻訳より優れているという研究結果も出ている。

日本語PEについて、プロ翻訳者と学生(TOEIC800程度)の修正量と負荷軽減、修正品質をそれぞれ比較したところ、プロはMT出力を無視する場合もあるがほぼエラーはなく、学生は10~25%の負荷軽減がみられたが致命的エラーが残存していた(ただし作業意欲は高かった)。結果がよかった学生は翻訳初心者に多い「分析的処理」(原文と訳文の形式的対応を重視)をしており、これがPEに向いている可能性がある。またスラッシュリーディングの要領で翻訳単位を細かく分けることが、MT結果の改善につながると考えられる。

ルールベース翻訳(秋元氏)

次に登壇した秋元氏はルールベース翻訳の概要と、翻訳失敗例、その具体的な対処法を紹介した。ルールベース翻訳は、原文を文分割したものに、「ルール」を用いて実装された形態素解析や構文解析などを順次適用して訳文を作成する仕組みで、ATLAS、The翻訳、PC-Transerなどのソフトがあり、訳揺れや訳抜けが少ない、レアな解釈でも文法的に正しいものを選ぶ等の特徴がある。

次に、参考として秋元氏の使用フロー例が示された。次のとおり。1)用語集設定→2)翻訳メモリ設定→3)コーパス設定→4)翻訳環境/専門語辞書選択→5)未知語抽出・登録→6)機械翻訳実行→7)各文を処理→8)用語抽出・用語確認
また、誤訳の種類と対処法も詳しく示された。たとえば係り受けや句構造解析のミスは、句をまとめる「フレーズ」、未知語は「辞書登録」で対応できるという。

統計ベース翻訳(内山氏)

最後に内山氏から、統計ベース翻訳の概要と、同氏が携わっている「みんなの自動翻訳@TexTra®」の紹介があった。(独)情報通信研究機構(NICT)多言語翻訳研究室は一般の機械翻訳、とりわけ特許分野等に注力している。

NICTの統計ベース翻訳では、入力文を構文解析してから語順変換を行い、訳語を選択する。統計ベース翻訳は、対訳の蓄積に伴って精度が上がる、訳語選択に強い、というようなメリットがあり、世界中で研究されている。

「みんなの自動翻訳@TexTra®」は、NICT提供の訳文に加えてユーザーの訳も取り込んだMTを作成するプロジェクトで、特許に関しては日英・日中ともに1000万文以上の対訳が登録されている。多くの人に使ってもらって、さらに改善していきたいとのこと。

質疑

「今後数年で機械翻訳はどの程度普及するか」「日本はTAUS(翻訳の技術革新を推進する組織)に参加する動きはないのか」など活発な質疑が行われた。