Googleは機械翻訳を変革する

2007.3.29 ITmedia News

米Googleの将来のビジョンでは、人々は文書を世界の主要言語に瞬時に翻訳できるようになる。その実現を先導するのは言語学の専門家ではなく、機械のロジックだ。

Googleのアプローチは統計的機械翻訳と呼ばれるもので、言語学の専門家が文法ルールと辞書をコンピュータにプログラミングすることを必要としないという点で、従来の機械翻訳の試みとは異なっている。

Googleのアプローチは、人間が既に翻訳して2つの言語のバージョンがある文書を、コンピュータに大量に入力し、そのパターンを認識させ、その蓄積に基づいて翻訳を行わせるというものだ。

・・・・(記事の転載ここまで)

「人間が既に翻訳してある、2つの言語のバージョンがある文書」とは、おそらくTRADOS等の翻訳支援システムを使って作られた、「翻訳メモリー」のことでしょう。また「主な素材は国連と欧州連合(EU)の文書」とあるので、この両組織は翻訳メモリーを公開しているのかもしれません。

翻訳メモリーのオープンソース化とGoogleの検索技術の融合に関しては、私が書いている他のブログのなかで触れています。

→ 翻訳メモリーのWikipediaの出現?

また、Googleの翻訳への取り組みの遅れに関しては、このブログの中でも最近取り上げたばかりです。

→ 言葉の壁とインターネットと将棋ソフト

「Googleが繰り出すサービスはどれも斬新で卓越しているのに、翻訳だけはダメだ」と言ったばかりですが、さすがGoogle、ちゃんと画策中だったのですね。

しかし、この記事の中で、

昨年、長期有給休暇を利用してGoogleのプロジェクトに協力したエディンバラ大学のマイルズ・オズボーン教授は、下記のように語っています。

「チェスの対戦では、コンピュータは人間と互角の勝負をするようになったが、ソフトウェアが人間の専門家の翻訳のレベルに追いつくことはないだろう。また、機械翻訳は、専門家に翻訳を頼むべきものかどうか、を判断するための材料に使えば有益だろう。例えば、日本語の特許文献を機械翻訳にかけて、重要な内容かどうか見極めをつける、といった使い方が考えられる」

まさに地に足の着いた、現実的な考え方ですが、これでは現在の状況と大差ない気もします。