映画スタートレックでは、異星人と即座にコミュニケーションが取れる万能翻訳機が開発されたのが2150年ごろでした。現実は、これより早く進んでいるようです。
2014年5月、マイクロソフト社は自社の年次カンファレンスCode Conferenceで、初めて「スカイプトランスレーター」アプリの公開デモを行いました。オンライン・ビデオ・チャットのスカイプ社でバイス・プレジデントを務めるGurdeep Singh Pall氏と、マイクロソフト社CEOのSatya Nadella氏が、ドイツ語を話すマイクロソフト社スタッフのDiana Heinrichs氏を相手に英語で会話し、アプリがその会話をリアルタイムに翻訳したのです。
こうしたデモが世間の関心を引き、話す言語にかかわらず相互理解を深められる翻訳ツールの開発に世界中の研究チームが力を入れ始めました。ゆくゆくは、こうしたツールによって、海外旅行や国際商取引、異文化コミュニケーションにおける数々の困難が解消され、文化の違いを尊重しながら障壁を排除できる可能性があります。
現在は不完全
「現在の音声翻訳は、文を文字通りに翻訳することに注力しています」と語るのはレイセオン BBN テクノロジーズ社のシニア・研究員Sean Colbath氏です。同社は航空宇宙と防衛の大手レイセオン社の系列会社で、米国マサチューセッツ州を拠点とし、音響学や信号処理、それと関連する情報技術を専門としています。「常識や文脈、会話が持つあいまいさは認識しません。たとえば何かの名前が出てくると、停止したり、文字通りに翻訳したりします。また、バスの時刻を尋ねた後で料金がいくらかと聞いてみると、音声翻訳はこの2つの文を関連付けず、バスの料金を聞かれていると理解できません」
それでも、音声翻訳技術の進歩は驚異的です。
業界の熱い関心
最近までニッチな用途しかなかった音声翻訳技術が、今やメイン・ストリームになり、大手投資会社の関心を集めています。たとえばフェイスブック社は、音声翻訳アプリJibbigoを手がけた企業を買収しました。グーグル社はGoogle翻訳の一環として80言語の音声翻訳を導入しています。また、電気通信の多国籍プロバイダーAT&T社の研究開発部門であり、米国を拠点とするAT&T Labsは、クラウド型の音声認識、言語翻訳、音声合成のエンジンを使用した研究を進めています。
AT&T Labsの技術チームのプリンシパル・メンバーであるSrinivas Bangalore氏は、「音声翻訳の関連技術は大幅に進歩しました」と語ります。「誤訳のない翻訳は実現できないかもしれませんが、うまく設計されたユーザー・インターフェースを持つ実用的なサービスによって、こうした制約を緩和できます。そのようなサービスがすでに実用レベルに達しています」
「音声翻訳は言語の壁を実質的に取り払うため、国際ビジネスのコミュニケーションが レベル・アップします」
Olivier Fontana氏
マイクロソフト社 機械翻訳グループ プログラム・マネージャー
決まった範囲の会話
現状の音声翻訳がもっとも力を発揮するのは、技術的に対応可能な範囲に話題が限定された状況です。イギリスを拠点とする翻訳会社Kwintessential社でマーケティング・ディレクターを務めるNeil Payne氏は、「音声翻訳は、文脈、ボディー・ランゲージ、感情といった微妙な情報を拾えません」と語ります。「しかし、医師と患者の会話のように、話題の範囲が限られた特定の用途で使えます」
米国カーネギーメロン大学言語技術研究所のコンピューター・サイエンティストで、言語合成の専門家でもあるAlan Black氏も同意見です。「現時点で音声翻訳がもっとも 役立つのは、国際的な救済活動など母国語以外知らない人とコミュニケーションをとる必要がある時です」と述べています。「たとえば、ミャンマーから難民を受け入れたとします。現地の医学校が難民たちの治療を行う中で、医師たちは難民たちの言葉を話せず、協力を得られる通訳者の数も足りない。こうした状況では、音声翻訳技術がきわめて有効です」
障壁の解消
技術の対応限界が広がると、さらに多様なユーザーのコミュニケーションに変革をもたらすことが可能になります。
「音声翻訳は言語の壁を実質的に取り払うため、国際ビジネスのコミュニケーションのレベル・アップになるでしょう」と語るのは、米国ワシントン州のマイクロソフト社で機械翻訳グループのプログラム・マネージャーを務めるOlivier Fontana氏です。
米国ユタ州を拠点として自動翻訳ツールを提供しているLingotek社の元CTOで、計算言語学者でもあるAaron Davis氏も同様の意見です。「音声翻訳にWebベースのリアルタイムなコミュニケーション技術を組み合わせることで、マルチユーザーの国際ビデオ会議という有意義な用途を実現できます」と語ります。「別の言語のほうが話しやすい人のために翻訳や字幕を提供することで、言ったことが正確に伝わっているという確信が持てるようになります」
音声翻訳技術は、エンターテインメント業界にも用途を見いだせるとDavis氏は考えています。「ビデオ・ゲームではすでに音声プロンプトが使用されていますが、チャットの翻訳で地球の反対側にいるゲーム相手とコミュニケーションをとれるようになります」
人間関係の促進も、有望な用途の一つです。「音声翻訳は、地理的に離れた友人や家族をつなぐという新たな機会をもたらします」とFontana氏は言います。「たとえば、中国にいる祖母がイギリスにいる孫と、たとえ同じ言語が話せなくても会話できるようになります」
文化交流
ほかの言語の会話を学ぶことへの関心が音声翻訳によって失われるのは必然と思われるかもしれませんが、研究者たちによれば、少なくとも現時点ではそんなことはないようです。「音声翻訳に関する研究では、文化的なメリットが認められることが多いです」とDavis氏は述べます。「コミュニケーションのために英語の学習を強制されなければ、言語をはじめとする自分たちの文化を大切にする傾向があります」
AT&T LabsのBangalore氏は、音声翻訳技術が異文化間のコミュニケーションを促進すると考えています。「翻訳技術があれば、言語の異なる人々ともっとコミュニケーションをとるようになり、言語学的にも文化的にも視野が広がるでしょう」と述べています。
Fontana氏も同様の意見です。「音声翻訳技術は言語学習を万人に開放し、容易にします」と述べます。「今までコミュニケーションをとったことがなかった人と、相手の言語が話せなくてもコミュニケーションできるようになります。言語学習を始めたばかりの人には補助ツールが提供され、より自信を持って自分のスキルを試せるようになるでしょう」
「くだけた会話にも次第に対応できるようになるでしょう。人々がその機能を求めており、開発に投資してくれているからです」
Alan Black氏
カーネギーメロン大学言語技術研究所 言語合成の専門家
将来の発展
シームレスでリアルタイムな翻訳が実現するのはまだ何年か先になりそうですが、音声翻訳技術はさらに多様な交流に対応範囲を広げています。
それでもなお、Davis氏は技術開発における「及第点」のアプローチに苦言を呈します。「翻訳の欠陥に目をつぶってアプリケーションを広く普及させれば、それ以上の完成度を求めなくなり、停滞を招きます」と述べます。「誤訳率はわずか10%かもしれませんが、微妙なニュアンスを取りこぼしている可能性もあります。その10%こそが、きわめて重要なコミュニケーションかもしれません」
カーネギーメロン大学のBlack氏は、この勢いが続く限り、音声翻訳技術はさらなるニーズや期待に応えて発達すると考えています。「ほかの人工知能と同様に、技術が向上するたびに限界値を塗り替えてしていくでしょう」と語ります。「完成することはありません。しかし、くだけた会話にも次第に対応できるようになるでしょう。人々がその機能を求めており、開発に投資してくれているからです」