同時通訳並みが実現するニューラル機械翻訳の「第3世代」とは?
通訳者がヘッドフォンやイヤホン越しに発言者の声を聞き、その内容を即座に翻訳してマイクなどの機材を通して話す「同時通訳」はこれまで、同時通訳者という人手を介して行われてきました。その同時通訳並みが遂に、機械翻訳で実現する時代がやってこようとしています。
今回は、「第3世代」と呼ばれる同時通訳並みが実現する機械翻訳について紹介します。
2016年11月に発表された第1世代NMT
2016年11月に初めて、NMT(ニューラル機械翻訳)を採用したGoogle翻訳が発表されました。同時期に、NICT(情報通信研究機構)もニューラル機械翻訳を採用し、大量データから作成した統計モデルを使用するSMT(統計的機械翻訳)と比べて、機械翻訳の品質が格段に向上しました。
この第1世代のNMTは、以前に計算された情報を覚える記憶力を持つというディープラーニングのRNN(Recurrent Neural Network/再帰型ニューラルネットワーク)をアルゴリズムに使用していました。
それに対して、ある単語の翻訳結果を決めるとき、その前後のどの単語に注目すればいいのか考える「注意機構」というAIの仕組みを取り入れた「トランスフォーマー」と呼ぶアルゴリズムを使用している第2世代NMTが2019年頃から登場しています。
2020年11月には機械翻訳による同時通訳並みの第3世代NMTを発表
NICTではこれまで総務省が2020年3月31日に発表した「グローバルコミュニケーション計画2025」に向け、文脈・話者の意図などを補う機械翻訳による同時通訳の実現を2025年の目標としてきました。ビジネスや国際会議での議論にも対応できる機械翻訳が誕生すれば、これまでよりも積極的な外国人材の受け入れが期待できるようになります。
さらに2020年11月に開催されたNICTの発表会では、機械翻訳による同時通訳並みのアルゴリズムが発表されています。その発表会では、発言から訳文が出てくるまで10秒ほどかかっていましたが、翻訳ミスはほとんどありませんでした。
既存の機械翻訳技術では、うまく翻訳していくためには文ごとにしか区切れないため翻訳にはタイムラグが生じていました。翻訳者で言う「逐次通訳」のような翻訳をしていたわけです。
文を言い終わる前から訳し始めることができれば、翻訳のタイムラグを縮めることが可能になります。そこでNICTでは、チャンクと呼ばれる意味の固まりごとに区切る技術を前処理に使用し、文単位での翻訳よりも細かく訳すことで、翻訳精度を保ちながらタイムラグを減らすことを可能にしました。
NICTの隅田英一郎フェローによれば、英日の翻訳精度はTOEIC(英語能力テスト)スコアに換算すれば900点くらい(英検1級程度)の高レベルをもられるほどの精度を持つと言います。
なお、チャンクは同時通訳者も使っている手法であり、より同時通訳並みの翻訳が機械翻訳でできるようになると期待されています。現在の翻訳タイムラグは10秒ありましたが、将来的には翻訳タイムラグを同時通訳者並みの2~3秒程度に縮まる可能性もあります。
第3世代のAI翻訳サービス新「T-tact AN-ZIN®」を2021年3月28日にリリースしました
このアルゴリズムは、トランスフォーマーに続く第3世代のニューラル機械翻訳となっており、主要なプレーヤーはこの新しいアルゴリズムへの切り替えが進み始めています。
十印でも、この新しいアルゴリズムを取り入れた第3世代のAI翻訳サービスである新「T-tact AN-ZIN®」を2021年3月28日にリリースしています。
十印で提供しているAI翻訳サービス「T-tact AN-ZIN®」とは
T-tact AN-ZIN®は、十印がNICTから技術提供を受けて開発したAI翻訳サービスです。T-tact AN-ZIN®で用いている翻訳エンジンは最新式のTransformerモデルエンジンであり、高い精度での翻訳が可能です。機械翻訳の品質検証に用いられるBLEUスコアでも高い数値が出ており、その品質の高さは折り紙付きです。
機械翻訳を初めて導入する場合には使い方に不安があるかもしれませんが、T-tact AN-ZIN®であればテキストをコピー&ペーストするだけで即座に翻訳することができます。また、過去の訳文を対訳集として登録することや、用語集を使って機械翻訳エンジンをカスタマイズすることも簡単にできます。
このT-tact AN-ZIN®の翻訳エンジンも第3世代へと進化しています。14日間無料でトライアルが可能なので、導入を検討したいという方はぜひ気軽にお試しください。
・T-tact AN-ZIN®の14日間無料トライアルはこちらよりご登録ください。
機械翻訳を導入する際には十印にご相談ください
十印は、1980年代前半から本格的に機械翻訳に取り組んできました。それぞれのお客様に最適な機械翻訳エンジンを提供しているのはもちろんのこと、プレエディットやポストエディットを含めたトータルでのサポートも行っています。機械翻訳の導入を検討している場合は、ぜひ十印にご相談ください。
十印の機械翻訳サービスについてはこちらをご覧ください。