十印五十年史・第三回「機械翻訳への取り組み」

2013/07/05

十印五十年史・第3回 

―機械翻訳への取り組み―


 

翻訳会社のパイオニアとしての使命

 

高度経済成長の盛り上がりが終息を迎えるまでに、その波に乗って業界のリーディングカンパニーとして成長を続けた十印は、柔軟に事業を展開することで石油ショックや円高ショックといった政治経済のあおりも乗り越えることができた。
1981年に設立した日本翻訳連盟の初代会長でもある勝田が率いる同社は、同業他社を圧倒する経験と豊かな人材を誇り、そのノウハウは他の業界からも注目されることになる。
そんな折に思わぬところからある先進的な事業への参加を要請された。Muプロジェクトと名づけられた、機械翻訳の研究プロジェクトである。


1983年9月JTF理事によるルクセンブルグの機械翻訳視察
 

同 プロジェクトは、科学技術庁(現・文部科学省)主導の下1982年に発足し1985年まで続いた。機械翻訳の可能性がまだ夢見がちに語られていた時代にお いて、実用化を目指した研究開発として最先端を行くものであり、30年程前のプロジェクトでありながら現在市販されている翻訳ソフトもその成果の上に成り 立っている。
Muプロジェクトは、自然言語処理のパイオニアであった長尾真教授率いる京都大学の研究室、電総研(現・独立行政法人産業技術総合研究所)の他、東芝、NEC、富士通、日立、沖電気と名だたる大企業が連なる産学官連携事業であった。
早 くも1960年代から機械翻訳の研究に携わっていた長尾教授は、実用になる本格的なシステムを作ってほしいという科学技術庁の依頼を受け、技術面では先進 企業の力を借りられれば心強いがそれだけでなく翻訳の実務に携わる者のノウハウもほしいと考えた。そこで翻訳会社として知られていた十印に声をかけた。
「機 械翻訳をやってる連中っていうのは、みんなエンジニアリング出身ですからね。言葉の、その翻訳のデリケートなところっていうのは、どうしてもなおざりにす るでしょ。そういうのに対して、やっぱり翻訳会社の人たちがそこをきちっとやるから、そのへんが非常に役に立つというか、参考になりますよね」と当時を思 い返して同氏は語る。
新しい試みや先進的な技術に常に意欲的な勝田は、長尾教授からの依頼を快く引き受けた。研究に投入する同氏の熱意への信頼と尊敬から勝田にとってはむしろ光栄であったという。十印は4年間に渡り、無償で人材とノウハウをMuプロジェクトに提供した。
結果として日本の機械翻訳技術を大きく前進させた同プロジェクトから十印が得たものは大きかった。
「それをきっかけに言語処理の経験が蓄積され、おかげでその後お客様の要望に応えるかたちでずいぶんといろいろなところでお手伝いさせていただきました」と勝田が語るように、十印は多くの有名企業と協同してMuプロジェクト以後も機械翻訳の研究に邁進していくことになる。
Mu プロジェクトの進行に並行して、他社に先駆けて機械翻訳を開発しようという大手企業から言語のスペシャリストの力を借りたいと十印に声がかかるようになっ た。その求めに応じ、言語処理プロジェクト部というチームが発足した。最盛期にはそこに70名ほど在籍し、各メーカーとタッグを組んで、言語の自動処理と いう難問と向き合った。
中でも最も大型のプロジェクトには50人もの人員を投入し、独自の辞書仕様書に基づいて単語と文法ルールを入力していった。
すぐに採算がとれるわけではない研究プロジェクトではあったが、高度経済成長期に力を蓄えた大手メーカーは惜しむことなく巨額を投じた。自動翻訳の実現は多くの者の情熱をかきたてる言語処理のフロンティアであったのだ。
自社の社員だけではとても対応しきれない需要の高まりを受け、十印はジャパンタイムスなどを通じ言語処理の人員を募集した。

 

1989年5月言語研究所での新入社員歓迎会
 

「英語はできなきゃいけない上に、最先端の技術に触れられるのですから仕事がおもしろかったんでしょうね。優秀な人ばかりずらーっと集まって、私なんかじゃとても面接なんてできませんでした」と勝田は自嘲気味に笑う。
実際に言語処理プロジェクト部の発足時から同部署で働いていた社員に話を伺うと、とにかく夢のある仕事だったと当時を思い返していた。
「あるルールに基づいて単語を入力していきました。出力文を見比べながら試行錯誤を繰り返すのが楽しく、寝食も忘れて打ち込んでいました」という言葉から当時の言語処理プロジェクト部の活気が伺える。
やがて言語処理プロジェクト部は、言語研究所と名前を変え、社内での機械翻訳の実用化を本格的に開始する。
機 械翻訳には二つの欠かせないプロセスがある。プリエディットとポストエディットだ。原稿を機械が読み込みやすいように加工するのが前者で、出力文をター ゲット言語の文章として質の高いものにするのが後者だ。当時から飛躍的に進化した現在の機械翻訳だが、基本的には多くのものがこの二つのプロセスを必要と している。この工程をいかに小さくするか、またいかに属人性を排除して質を統一するか、機械翻訳の実用化はこの二点にかかっている。
当時の限ら れ た技術のなか、なんとか機械翻訳を実用しようという試行錯誤の末に十印がたどりついた方法は、プリエディットの工程を省き、ポストエディットの代わりとな るリライトという作業で機械翻訳からの出力文を自然な言語に直すというものであった。試験的に言語方向は英日に限定し、得意とするマニュアルの翻訳に分野 を絞った。マニュアルの文章は一般言語に比べ、文章の意味が特定しやすい、過去形がない、人が目的語にならないなどいった自動翻訳に向く特徴を持っていた ためだ。こうして十印は機械翻訳の導入に踏み切ることになる。1990年のことだ。
いくつかの制限がついてはいたが、英日のマニュアル文章の機械翻訳は一定の成果を上げた。外資系企業の日本進出が盛んな折であったため需要も高く、機械翻訳の夜明けを予感させる技術は話題にもなった。
しかし、そのノウハウをそのまま他の分野や別の言語の翻訳に活かすにはまだ時期尚早であった。一番の壁はやはり先述のリライトの工程に多くの時間が割かれることであり、またその質を一定に保つことの難しさもあった。
その後も一流メーカーとタッグを組んでの十印の試行錯誤は続くのだが、結論から述べるなら、機械翻訳の本当の夜明けはもう少し先であった。


1992年10月目黒須田ビルでの言語研究所仕事風景
 

言 うまでもないが機械翻訳は当時から約30年を経た今でも未完成の技術である。ソフトとしては商品化されているが、そこから出力された訳文が商品として通用 するまでにはまだ時間がかかりそうだ。現在も十印を含めた様々な企業が機械翻訳の実現に向けて取り組んでいるが、それらのアプローチは30年前とは全く 違ったものである。
ではMuプロジェクトに連なる十印やその他の先進企業の取り組みは全て水泡に帰したのかというと、決してそうではない。多く の 成功と失敗のステップを一段一段積み上げてきたことで現在の最先端の機械翻訳が存在しているのだ。その技術の変遷を眺めると、試行錯誤が必要だったのだと 思わざるを得ない。
翻訳会社のパイオニアとして、言語のスペシャリストとして、どこよりも早く機械翻訳の夢に取り組んだ十印の功績は大きいだろう。
 


1994年3月言語研究所の集まり
 

取材著作:日本翻訳ジャーナル、取材協力:株式会社十印