21世紀の翻訳 - Amazon Web Services

21世紀の翻訳
フェイスブック、グーグル、IBM、マイクロソフトの向かう先とは?
テクノロジーの未来を予想するお決ま
りのジョークがある:それは
完全に自動化された機械翻訳が『5年
以内に』実現するというもので、この
予想は1980年代からあった。だが、今
回ばかりは、それが現実のものとなり
そうだ。
TAUS ARTICLES
PERSPECTIVES
翻訳業界は伝統的にワークフローへの機械導入に消極的だが、TAUSは2005年から業
界のリーダーたちを集め、翻訳分野の技術に対する意識向上に
努めてきた。2008年には言語関連ビジネス・イノベーションに関する報告書を発表
し、新世紀のグローバルな挑戦を受け入れる覚悟のある翻訳業界の鍵を握
るトレンドとして、翻訳の自動化、クラウドソーシング、言語データ共有を挙げた
。そこから少し経過した今、そうした変化の兆しがあちこちに表れている。
技術革新のスピードは明らかに加速している。そこで、伝統的な5年計画に従って、
21世紀初頭の翻訳業界の原動力となる技術やビジョンに焦点を当てる。
フェイスブック、グーグル、IBM、マイクロソフトの向かう先とは?
21世紀に入ったばかりの頃、翻訳を取り巻く状況が短期間にこれだけ大きく変化す
るとは想像しにくかった。言い換えれば、フェイスブック、グーグ
ル、IBM、マイクロソフトの4社が、エンドユーザーとビジネスによる翻訳体験にこ
れだけ大きな影響を及ぼすとはあまり想像できなかった。




Facebookは5億人のユーザーを集め、ローカライズのほとんどをユーザーの力に頼っ
ている。
Googleのコンピュータが翻訳する単語数は、全世界のプロ翻訳者がこなす量の10倍以
上に上る。
IBMは、自社の機械翻訳エンジンのカスタマイズにその世界的な労働力を充てている
。
Bill
Gates(ビル・ゲイツ)はついにマイクロソフトの5つの戦略的技術の一つとしてMT
(マイクロソフト・トランスレーター)の名を挙げた
こうした主要IT企業の活動とビジョンは、われわれのデジタルライフスタイルや企
業活動を支える技術インフラの大半を占めている。そして、これらはすべて、翻訳
技術と翻訳プロセスに深く関連している。
わずか6年で、フェイスブックは約5億人が加入するソーシャルネットワーキングコ
ミュニティを作り上げた。フェイスブックは国にたとえるなら、世界
第3の人口を持つ国となる。わずか2年間で、そのインターフェースは75言語にロー
カライズされた。わずか2年間で公用語が75言語になったのである。
今ではフェイスブックのユーザーの半分以上が、英語を使わない人たちだ。75言語
のうち20言語はプロによって翻訳されたが、残りはコミュニティ翻
訳の力を借りた。フェイスブックには40万人の翻訳ボランティアがおり、そのうち4
分の1、すなわち10万人は週1回の頻度で積極的な支援を行っている。
ふと疑問がわく。もし10万人のユーザーが喜んでフェイスブックに翻訳サポートを
提供するなら、これらの人々が互いに助け合うよう要請されたらどうなるのだろう
2
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
?世界のプロの翻訳者人口よりも大規模なコミュニティが力を結集させ、ボランテ
ィア翻訳をするであろうことは容易に想像できる。
われわれが翻訳についての21世紀の展望にフェイスブックを含めたのは、彼らの現
在の事業内容が理由ではなく、世界最大のソーシャ
ルネットワーキングコミュニティが翻訳ソリューションにもたらす大きな潜在能力
を感じたからだ。フェイスブックや他社が、この潜在能力に気づくかどうか楽
しみだ。
グーグルについてははっきりしている。世界の情報を組織化するというミッション
どおり、グーグルは、当然のことながら、書き言葉と話し言葉の持つ戦
略的価値、つまり、情報を活用することを可能にする手段に取り組んでいる。生き
残るには、あらゆる言語で提供される検索コンテンツとそのコンテンツに対応
したアドワーズ間の、言語と意味の明確な関連性を維持していかなければならない
。つまり、ユーザー生成型の多言語情報に対応する能力がグーグルのビジネス
モデルにとって不可欠なのだ。Google翻訳は、インターネットにアクセスできる人
であれば、誰にとっても自動翻訳を身近なものにした。しかも、5年前
にはほとんど想像もできなかった幅広い言語に対応している。翻訳の実用性に対す
る肯定的な受け止め方が広がるという点で、そのメリットは計り知れない。 Google
翻訳の提供開始以来、わずか2年間で『translation(翻訳)』を含む検索語が4倍に増え
たことでも、この傾向は明らかだ。
Google翻訳は、翻訳業界と情報の消費者双方の考え方を根本から変える強い力を持
っている。
長年にわたり機械翻訳に取り組んできたイノベーターとして広く認められているIB
Mは、企業やビジネスユーザーに、より大きな影響力を与える可能性
が高い。IBM会長肝いりの10件の企業革新プロジェクトの一つとして、『n.Fluent』
プロジェクトを開始した。言葉の壁は、同社のグローバルビジ
ネス展開だけでなく、世界的な顧客基盤を持つ他の企業にとっても戦略的課題であ
ると判断したのだ。企業向けリアルタイム翻訳ソリューションの提供で新たに
ライオンブリッジと提携関係を結んだことは、このプロジェクトの現在進行中の進
化の一端が表層化したに過ぎない。クラウドを基盤としたこのサービスは、個
別の組織のコンテンツや事業プロセスに応じてカスタマイズ可能で、Google翻訳の
顧客志向とは異なり、企業に『プロの』翻訳を提供する。
世界中の顧客、従業員、パートナーとの言語の壁を越えたコミュニケーション改善
に尽力するIBMの姿勢は、企業ユーザーの手本になるだろう。
マイクロソフトは、ほとんどの会社より前からローカリゼーションの問題に取り組
んできた。消費者志向の一流グローバルIT企業として、マイクロソフ
トは何十年にもわたって、実行しうる効率的な方法で、エンドユーザー、顧客、パ
ートナーの言語に対応してきた。同社は以前、最先端の機械翻訳を開発する試
みを、その時点で進行中の製品のローカリゼーションとは別に行っていた。だが、
創設者のBill
3
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
Gates(ビル・ゲイツ)が、優れた革新力を持つ戦略的技術の一つに完全な自動翻訳を
挙げたことで、その方針は変わった。今では、ソリューションの一つ
として翻訳に力を入れ、カスタマーサポートのサイトで機械翻訳サービスを提供し
ている。
最近では、マイクロソフトの機械翻訳チームが、地震救援活動の際にハイチ語の自
動翻訳を提供する極めて重要な実験に関わった。2010年1月下旬の
4日間17時間31分で、その場で入手できたデータを使った英語-ハイチ・クレオール
語の機械翻訳システムを構築した。グーグルもまったく同じことをし
た。これはなにも驚くことではない。
マイクロソフトの活動は、翻訳は世界の消費者や市民の公共サービスであるという
傾向を裏付けた。翻訳は問題というより、ソリューションなのだ。
公共サービスとしての翻訳
翻訳業界の起業家は長い間、自社製品やサービスが顧客企業に本当の意味で評価し
てもらえないことに不満を覚えていた。翻訳は常に、補足的なものだった。たと
えば、相手が『自分と同じ言語』を話さないと秘書が気づいた時に、初めて検討さ
れるようなものだった。果たして、今でもそうだろうか?翻訳は企業戦略にど
れだけ関係しているか?経営幹部たちは言語のことなど気にかけるだろうか?翻訳
に投資する必要性があるのだろうか?翻訳は単なる事業経費なのか、それとも
新市場進出への鍵なのか?翻訳はコスト節減、収益獲得の助けになるだろうか?
翻訳における世界最大の顧客である欧州委員会翻訳総局(DGT)は、欧州連合の市
民が支払う年間の翻訳コストは1人あたりわずか2ユーロであるとの
計算結果を発表し、約10億ユーロに上る翻訳予算を擁護した。驚くべきことに、こ
の2ユーロという数字は、市場調査会社の推定による世界の翻訳業界の規 模、
約150億ユーロからも導き出される。だが、もっと興味深いのは、DGTの視点が翻訳
を税金で賄われる公共サービスとしてとらえている点だ。ビジネス界が
翻訳コストの正当化に苦労する中で、新たなビジョンが徐々に見えてきた。翻訳は
問題ではなく、ソリューションの一部だ。標準機能であり、無料または状況に
合った方法で支払われる当たり前のサービスなのだ。
われわれが思い描く21世紀の世界では、翻訳は言語ペアや情報の種類に関わらず、
いつでもすぐに利用可能であり、税金で、または公共サービスとの
セットとして支払いが行われる。代表者の話では、翻訳にもっとも意欲的と思われ
るDGTでさえ、現在、必要なもののごく一部しか翻訳していないという。わ
れわれの推定では、必要な時にすべてを翻訳するという考えに近づくための総コス
トは、世界の市民1人あたり平均10ユーロ、合計700億ユーロかかる。政
治的、経済的、社会的、文化的、そして治安的な面でメリットがあるので、この費
用の助成に関心を持つ関係者は多いとわれわれは確信する。
4
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
誰もが送り手にも受け手にもなれるコンテンツが急増している世界では、従来の出
版社や企業が従来と同じ基準で翻訳料金を支払い続けることなど期待で
きない。翻訳はたちまち、(公共または民間の)一組織の予算内ですべてを処理す
るにはあまりに費用のかかるものとなってしまうだろう。これを解決するに
は、共有サービスという視点が必要だ。21世紀の翻訳は、地球上のすべての人のた
めの基本的な公共サービス、つまり、誰もが要求し期待できる人権の一つに
なるだろう。言語の翻訳は電気、水道、道路、インターネットと並んで、人間の文
明を現在の高みに押し上げてきた基本サービスの一部なのだ。
では、ビジネスとしての翻訳はどうなるのか?企業は製品ごとの限定的なローカラ
イズから、より積極的な全社規模の言語戦略に移行していくと予想され
る。(たとえ不完全でも)手軽な基本翻訳が使える共有公共サービスをうまく活用
するだろう。しかし、自らを差別化して優良な顧客を獲得するため、付加価値
の高い個別化のサービスとローカライズサービスに対する需要はなくならないだろ
う。公共サービスとしての翻訳は、企業情報システムに組み込まれた新世代技
術によって使用可能となり、プロの翻訳方法やアプローチに大きな影響を与えるこ
とになるだろう。
このビジョンが具体化すれば、翻訳は初めてビジネス戦略活動の1つとなる。そうな
ると、われわれは翻訳モデル、考え方、アプローチ
を変更する必要に迫られることになるだろう。翻訳がソリューションとなると、翻
訳は、情報・コミュニケーションシステムにおいてこれまでになかった新しい
役割を果たすことになる。
翻訳技術の前進
言葉の壁が消えていく世界という遠大なビジョン。そこでは、技術が要因なのかそ
れとも結果なのかは重要ではない。技術の進歩とビジネスの革新は密接
に関連し合いながら、現在、加速度を増して前進している。人と人とのつながりの
持つ力や、オンラインのソーシャルコミュニティの会員数が世界の大国の人口
を上回り始めているという驚くべき事実に注目しよう。翻訳やカスタマイズや編集
の人材リソースという視点で、こうしたコミュニティの持つ潜在的な力を考え
てみよう。翻訳をデータととらえ、この何百万、何十億という単語量を有するデー
タが、新しい機械翻訳エンジンのトレーニング用のデータになることを想像し
てみよう。今や、最も頑固な懐疑主義者でも、しばしば機械翻訳出力の品質に驚い
ているのだ。
わずか5年前には、機械翻訳の急速な成長を予測したTAUSの見通しに対して、懐疑
的な意見が多かった。
機械翻訳は半世紀以上にわたる翻訳技術の研究により多大な基盤が築かれ、21世紀
に入ってさらなる向上をみた。当然だが、機械により多くのデータを
入力しさえすれば、性能が向上するわけではない。研究者たちが今取り組んでいる
5
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
のは、既存のデータ駆動型のツールやエンジンに、統語論的な分野や意味論的
な解析などのデータを適用する新世代の機械翻訳技術だ。新しいハイブリッド機械
翻訳エンジンは、タスクに合わせたさまざまな技術的アプローチを組み合わせ
ており、近い将来、現世代モデルの性能を上回るだろう。こうした技術は全言語に
役立つわけではないが、技術の改良と着実な進化によって、すべての言語ペア
にとってよりよい翻訳が得られるようになるはずだ。
今後、言語翻訳を根本から変える科学的な大躍進はあるだろうか?おそらくないだ
ろう。今後、翻訳技術の改良は進み、加速度を増していくだろうか?も
ちろんだ!科学的なパラダイムシフトがない状況では、人間の言語知識の共有に解
決策を求めることになるだろう。われわれは、オンライン連携や大きなコミュ
ニティを巻き込んで言語知識の共有に取り組むための洗練された方法を生み出して
いる。翻訳の課題を解決することは、オンラインゲームと同じくらい面白いも
のになり得る。
IBMは、自社のグローバルな労働力をIBM翻訳エンジンの性能向上に活用している。
グーグルは大量の未加工データによって新領域を開拓する一方
で、可能性の限界にも気づいている。記録的な10万もの言語ペアの自動翻訳はばか
げた間違いを生成するのだ。Google翻訳部門のトップ、Franz
Och(フランツ・オッホ)は、最近行われた『フォーブス』誌とのインタビューで「現
在の進捗状況では人工知能に届きそうもない」と語っている。コン
ピュータは学習方法を学ぶ必要がある。コンピュータに入力する人間の脳のように
。問題のある翻訳を指摘するGoogle翻訳の訳文提案機能は、そのための
一歩なのだ。
翻訳技術は過去5年間で世代を超える飛躍と前進を遂げた。次の5年間には、いつで
も、どこでも、誰でも使える公共サービスとしての翻訳をサポートするツールの拡
大と改良がみられるだろう。
言語データ利用へのシフト
過去20年間の翻訳業界で最も生産性向上に貢献したのは翻訳メモリ(TM)である。
保存された既訳文を文単位、語句単位で再利用できるようにしたデータベー
スファイルだ。現在、業界の注目は生の言語データに移行している。ある程度は従
来と同じデータだが、使い方が異なるため別の名がついている。翻訳メモリが
最も威力を発揮するのは、過去のリリースの訳文のリサイクルが多い環境でのプロ
ジェクトのケースだ。これに対し生の言語データは、すべてのマッチをレバ
レッジし、機械翻訳エンジンをトレーニングし、カスタマイズするために、ネット
ワーク上のコミュニティやクラウド・コンピューティング環境など大規模なス
ケールで利用できる。
翻訳メモリ管理から言語データ管理への移行は、人間の頭脳と職人的な技の多くを
翻訳作業から不要にするだけに、従来型の翻訳者にとっては不安の種
6
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
だ。しかしながら、膨大な量の言語データの可能性には目を見張るものがある。機
械翻訳エンジンのトレーニングはもちろん、高品質な意味解析を可能にする同
義語のタグ付けやテキスト処理など、用語上の作業にも利用できる。言語コーパス
が十分に大きい場合は、翻訳の品質を測定し、怪しげな翻訳を取り除くことす
ら可能だ。その上、言語データと言語解析ツールは、テキストマイニング、検索、
センチメント分析、顧客満足度の測定など他の情報管理アプリケーションで急
速に使われるようになっている。この傾向は、より高度な機械翻訳のための言語リ
ソースの入手を容易にするだろう。
言語データの重要性は、プライバシー、守秘義務、標準、タグ付けやクリーニング
の可能性に関する新たな疑問や問題を提起する。データクリーニングや
最高の使用環境に結びつける作業を、どれだけ自動化できるだろうか?膨大な言語
データを分析、分類することによって、どれだけ精度(関連性や意味的な整
合)を上げられるか?
共有ツールとユーティリティを組み合わせたクラウドTMモデルへのシフトは、既に
大々的に起こっている。例えば、フェイスブックには、コミュニティ
からの大量の翻訳データを集計し、再利用を最適化するフェイスブックコネクトと
いう機能がある。グーグルには、翻訳者が効率的な翻訳ツールを無料で使用し
て、より大きなコミュニティと翻訳を共有できるGoogle
翻訳ツールキットがある。また、IBMはTranslation
Workspaceの共有リソースを利用するため、ライオンブリッジと提携している。2008
年には、業界リーダーが力を合わせ、言語データ共有の業界共
同プラットフォームとしてTAUSデータ協会を設立した。一方、欧州委員会は、大量
のデータを共有する未来に向け、
FlarenetやMetashareなどのプロジェクトを支援している。
こうした異なるプラットフォームや戦略をどう解釈するか?そして、合意点をどこ
に見いだすか?この進化の次の段階は、貴重な言語データとツールでリポジトリと
無数のコンピュータを接続する、分散型ピアツーピアネットワークである可能性が
高い。
そして、翻訳業はどうなるのか?
技術とビジョンが一つになると、翻訳業は危険にさらされるのだろうか?機械翻訳
エンジンの性能が上がり、リアルタイム翻訳が標準になった時、エンド
ユーザーが多くの使用状況で「まずまずの」翻訳に満足するとしたら、機械翻訳エ
ンジン出力のポストエディットに将来はあるのだろうか?翻訳者と技術との新
しい連携は、相互強化の好循環の中で生まれるのだろうか?言語サービスプロバイ
ダは、技術のヘビーユーザーになるのか、それともリモートサービスと顧客を
つなげる単なるパイプラインになるのか?技術開発者は、特定のアプリケーション
分野向け、または言語サービスプロバイダのテキスト向けに特化したシステム
7
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
を量産する機械翻訳エンジン工場を作るのか?それとも、言語サービスプロバイダ
を翻訳ワークフローの舞台中央に戻す『品質回帰への反動』があるのだろう か?
4万ものUI文字列と30万語の製品ローカライズ翻訳にクラウドソーシーングを活用し
たことで有名なフェイスブックは、翻訳のプロではないものの、
翻訳作業に興味を持つバイリンガルは多いとみている。フェイスブックは大規模な
翻訳のクラウドソーシングに一番成功した例だが、オープンソース・コミュニ
ティに根ざすこの傾向は、世界的な翻訳活動の一大シェアに成長しそうだ。
グーグルは1~2年前、『Google Translation
Center』構想に関する一時的なニュースで懸念を引き起こしたが、クラウドベースの
データ管理ツールを翻訳者に提供し、同社の持つ莫大な翻訳データの
蓄積へのアクセスを可能にしている。その真意はおそらく、翻訳者はもちろん誰で
も支援するが、『業界』については必ずしも支援するわけではない、というこ
とだろう。グーグルは集積した知識の利用を広げていくために、翻訳者やその予備
軍を動員している。例えば、2年間にわたり、ウィキペディアの記事をイン
ド、中東、アフリカの言語に翻訳するチームを支援してきた。これらの地域の言語
に翻訳された単語数は1,600万語を超える。グーグルによると、他のイン
ターネットユーザーも、ウィキペディアのコンテンツの1億語以上を世界のさまざま
な言語に翻訳するためにグーグルのツールを使用しているという。
プロの翻訳者はもちろん、今後も消えることはないだろう。だが、機械翻訳が生成
した訳のような『まずまずの』翻訳をする多数のセミアマチュアや翻訳愛好家が『
同業者』に加わることになるだろう。
新しいアプリケーションへの扉を開く
ビジョンと技術が一致すれば、数多くの新しいアプリケーションの誕生が期待でき
る。実際のところ、既に登場したアプリケーションもある。自動翻訳はサポート
サービス、ソーシャルネットワーク、テキストメッセージには既に組み込まれてお
り、継続的な使用によって完成されていくだろう。また今後は、音声コミュニ
ケーション(音声対音声翻訳)
など言語中心のメディアや、映画の字幕などマルチメディア環境、視覚・言語障害
者用のさらに制約の多いアプリケーションに新たな市場を見出すだろう。内蔵
の機械翻訳は、トップダウン式に言語を押しつけるのではなく、ユーザー中心の言
語バージョンを提供することが可能だ。例えば、掲示板や道路標識、または空
港、駅、病院、政府庁舎等の案内図に2~3種類の言語で表示する代わりに、携帯カ
メラ機器や眼鏡を用いて、ユーザー個人の用途に合わせることができる。ユ
ビキタスなデジタルの世界では、クラウド・アプリケーションによって、すべての
言語関連メディアが自動的にユーザー翻訳可能になるだろうか?それとも機械
翻訳は、サービス・プロバイダに限定される局所的な作業であり続けるのだろうか?
8
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
フェイスブックは現在、プライバシー、マナー、情報共有の倫理面についての問題
への取り組みを優先させているが、他のソーシャルメディア・プラット
フォームと同様、もっと洗練されたサービスを望むユーザーの強い要求に応えなけ
ればならないかもしれない。ユーザーは、ネットワークへの多言語インター
フェースだけでなく、多言語の参加者間の関係構築も望んでいる。大きなコミュニ
ティが同じ関心を持ち、密なコンタクトを希望する小さいグループへ『分裂』
していくのに歩調を合わせるように、インスタントメッセージの自動翻訳はすでに
登場している。Windows Liveメッセンジャーの『Bing
Translator』や、その他のインスタントメッセージ・サービスのための、一連のニッ
チなプラグイン翻訳エンジンがその例だ。フェイスブックの翻訳
担当幹部の言葉を借りれば、同社はユーザーごとに異なる言語モデルのサービスを
開発する必要があるかもしれない!
グーグルの翻訳の未来は、皮肉なことに、テキストよりも音や映像と関係が深いか
もしれない。
同社は自社の携帯電話向けOS『Android』を宣伝する一方で、音声認識を積極的に研
究している。携帯電話のような小さいサイズでの検索や他の
情報収集活動を可能にすることに関心があるのは明らかだ。電話使用が、テキスト
データより大きい音声データのリポジトリ構築を促進するのは間違いない。音
声をテキストにいったん変換すれば、どちらも最終的には同じ翻訳エンジンの利用
が可能になるだろう。今年発表された『Google
Goggles』アプリケーションは、基本的にはカメラである。テキスト(メニュー、広告
、道路標識など)の写真をとってGoogle翻訳に送れば、
Goggle利用者の言語でテキストの意味を調べることができる。
長きにわたり、音声、テキスト、その他の言語技術の研究・開発の中心的存在を担
ってきたIBMは、理論上、翻訳の質の向上を企業のITインフラにも
たらすうえで、有利な立場にある。実際には、ビジネスプロセスを簡素化、最適化
できる場所すべてに自動翻訳機能を組み込むことに集中する可能性が高そう
だ。現在のクラウドソーシング活用の努力は、例えば製品ライフサイクル管理など
で、統合型自動化情報フローを構築する包括的プロセスへの過渡期となるかも
しれない。
自然なユーザーインターフェースの開発を目標に掲げるマイクロソフトは、自動翻
訳が一層透過的になり、状況や場所によらず利用できるように複数のコ
ミュニケーション・プラットフォームで動作するようになると予想する。マイクロ
ソフトは自社の音声技術も開発中である。音声翻訳の可能性追求に必要な要素
を統合し、『Windows 7 phone』を発表するプロセスを進めている。
これらの革新的な4社は、21世紀の翻訳の新しい姿を示している。新しい姿とは、世
界の大半の言語での情報とコミュニケーションへのユニバーサルで
ユビキタスなアクセス。それは、洗練された技術の支援を受けたプロの翻訳者や献
身的なボランティアによって可能になる。翻訳業界にとって面白い時代がやっ
てきたのだ!
9
COPYRIGHT ©TAUS 2010
TAUS ARTICLES
PERSPECTIVES
この記事は、翻訳界における主な変化を評価するシリーズの第1弾である。変化は希
望や不安を生むと同時に、政府、企業、一般市民、
学界、翻訳専門家に行動を促す。今後の記事では、今回取り上げた広範囲の問題を
もっと深く掘り下げていく。これまで同様、読者の方には、変化を受け入れ、
主導権を握り、成長を目指すよう訴えたい。
10
COPYRIGHT ©TAUS 2010