日中韓連携 電子図書館

2010.5.12 朝日新聞朝刊

2010.5.12 朝日

この記事の文面からすると書籍を「電子化する」の意味が、過去の紙の書物をスキャナーで読み込んで電子化するのか、あるいはOCRで読み込んでテキスト入力するのかは不明です。後者であれば膨大な量の入力作業が発生するでしょう。

そういえば10年ほど前にそのような書籍のテキスト入力の仕事が膨大に発生していると、あるDTP専門会社の人から聞いたことがあります。現在はどうなっているのでしょうか。いずれにしても自動翻訳するためには、最低限書籍のタイトルだけはテキスト入力されている必要があります。

しかし、仮にタイトルが翻訳ソフトで正しく翻訳されたとしても、目的の書籍を検索した人は、その書籍の中身が原文のままであれば理解はできないはずです。逆に理解できるほどの語学力を持つ人であれば、自分でキーワードを入力して、自力で検索するでしょう。

となると何のための「翻訳機能」なのでしょうか?「いずれは本文も自動翻訳して各国語で読めるようにしたい」ということですが、そのためには前述のとおり、まずは本文の全てをテキスト化する必要があるため、膨大な時間とコストがかかります。しかし仮にそれをやったとしてもコンピューターによる「自動翻訳」であれば、現実的には実用レベルに達するまでにかなりの時間を要することになるでしょう。というより本当にできるのでしょうか?

一つ考えられることはまず必要のありそうな書籍を検索してから自動翻訳し、なんとなく興味がありそうなものだけを改めて人間に翻訳をしてもらう、という使い方です。

ただそれも明治・大正期の書籍にどれほどの需要があるのか疑問です。要するに結論としては「無駄に税金を使わないで欲しい」ということだけです。