言葉の壁とインターネットと将棋ソフト

2007.3.26 Tech-on

(前略)
ところで,インターネット検索サイトのGoogleは「世界中の情報を体系化し,アクセス可能で有益なものにする」というのがミッションだそうです。実際,Googleの繰り出すさまざまなツールやサービスは,どれもその目的にかなう優れたものだと感じていますが,残念ながら翻訳ツールに関してはお世辞にも誉められたものではありません。天才プログラマーがおおぜいいるらしいGoogleでも,自然言語処理の革新的アルゴリズムはおいそれと見つからないのでしょう。

(中略)
さて,ここで話が戻ります。翻訳という作業は,毎日毎日,世界中で大量に行われています。もし,これらが対訳集としてインターネット上で公開されていたらどうでしょう。コンピュータは文章の意味など理解できなくても,膨大な対訳データベースがあれば,それを元にして相当,的確な翻訳ができるのではないでしょうか。Googleの人もそのことには気づいているでしょうが,残念ながら原文と訳文はたいてい別々に掲載されます。そこでWWWコンソーシアムなどが音頭をとって「翻訳文を載せるサイトはできるだけ原文も載せること。ただし“対訳タグ”を付ければ原文は非表示でもよい」などのルールを決めるのです。世界中の翻訳者が協力すれば,すぐに実現できるアイディアだと思いませんか。

・・・・(記事の転載ここまで)

翻訳会社の経営者にとっては、なかなか興味深い記事です。この記事の趣旨を下記のように、「起承転結」でまとめてみました。

(起) 英語が世界共通語として普及してきたとはいえ,まだまだ私たちは高い言葉の壁にさえぎられている。

(承) Googleの繰り出すさまざまなツールやサービスは,どれも優れているが、翻訳ツールだけはダメ。天才プログラマーがたくさんいるGoogleでさえ,自然言語処理の革新的アルゴリズムは見つけられない。

(転) 先週、将棋ソフトも人間に勝てるレベルに近づいて来たらしい,というニュースが流れた。なぜ将棋ソフトが強くなったかと言うと,膨大な量の棋譜をソフトに読み込ませたため。

(結) 世界中で毎日大量に行われている翻訳を、対訳集としてインターネット上で公開し、その膨大な対訳データベースを利用する翻訳ソフトを作れば、かなり的確な翻訳ができるのではないか?

実は昨年の9月に、私はこれに関連した記述を私が書くもうひとつのブログの中で書いています。

翻訳メモリーのWikipedia化に続き、パーソナライズされた情報を各個人へ発信する検索エンジンの登場により、より完成度の高い「翻訳ソフト」が出現してくる、というストーリーです。そして最後は、このような言葉で締めくくりました。

「この項の最後に一言だけ付け加えておきます。
ダーウィンの『種の起源』の中に、次のような言葉があります。

『強いものが勝つわけではない。
賢いものが勝つわけでもない。
変化するものだけが勝つのである』」