2021.03.01

機械翻訳の精度を向上させる「アダプテーション」とは

機械翻訳の精度を向上させるにあたって重要なものの1つに「アダプテーション」があります。十印でも機械翻訳にアダプテーションを取り入れており、訳文の質を大幅に上げることに成功しました。ここでは、アダプテーションの概要およびアダプテーションを利用した十印の機械翻訳サービスについてご紹介します。

アダプテーションとは

従来、機械翻訳の精度を高めるためには大量の対訳データを用意して機械学習させる必要がありました。質の高い機械翻訳を実現するために必要な対訳データは、1億文~10億文ほどだといわれています。しかし、これだけの量の対訳データを集めるためには時間と費用がかかります。さらに、特定の分野における翻訳に適用しにくいという欠点もありました。

そこで現在注目されているのが、「アダプテーション」という技術です。アダプテーションとは汎用機械翻訳モデルの対訳データに特定の分野の対訳データを追加して再度機械学習させる方法のことで、これを実施することでその分野の機械翻訳の精度を上げることができます。アダプテーションの手法はいくつかありますが、どれを採用した場合でもその分野に特化した対訳データの量は比較的少量で済むのがメリットだといえるでしょう。

例えば「study」という単語には、「勉強」、「学習」、「研究」など複数の意味が存在します。原文中にこのような多義語がある場合、機械翻訳を使うと不自然な訳文になることが少なくありません。しかし、医薬関連の対訳データを用いて機械学習させることによって「研究」という適切な訳を選ばせることが可能になります。

また、アダプテーションの技術はそれぞれの企業に特化した翻訳エンジンの作成に応用することもできます。社内知識が多い場合なども、アダプテーションを利用して機械学習させることで自然な訳文が仕上がるといえるでしょう。

十印の分野ごとの専用エンジン

十印では、この技術を使用して作成された分野ごとの専用エンジンを提供しています。2021年2月現在は、以下の分野に対応しています。

・特許
・特許請求項
・半導体
・金融(2020年8月リリース)
・リーガル(契約書)

半導体エンジン(英日翻訳)を用いて品質評価を行ったところ、BLEUスコアが30.1から35.5と5ポイント以上アップしました。これは、機械翻訳の訳文が人間の翻訳者の訳文に近くなったということを示しています。

リーガルエンジンは、国際取引コンサルティング・サービスを展開している国際事業開発株式会社(IBD)と共同で開発を行いました。売買関係契約書、販売店関係契約書、代理店関係契約書、業務委受託関係契約書、知的財産関係契約書、投資関係契約・定款、プラント関係契約書、各種契約・合意書などを用いて機械学習を行っています。

BLEUスコアにおいては、英日翻訳では33から46まで、日英翻訳では34から47まで向上しました。Google社の基準ではBLEU値40~50を「高品質な翻訳」としており、十印のリーガルエンジンは高い精度を実現しているということが分かります。さらに、翻訳者からも「人間の翻訳者と同等/人間の翻訳者の翻訳よりも高品質」という評価を得ています。

なお、十印では今後も分野ごとの専用エンジンを追加していく予定です。

特許出願中の十印のサービス

十印では、アダプテーションを利用した「翻訳エンジン取引所(仮称)」、「翻訳エンジン診断」、「AUTOMADE(オートメイド)」の3つにおいて特許を出願しました。ここでは、それぞれのサービスの内容をご紹介します。

■翻訳エンジン取引所(仮称)
翻訳エンジン取引所では、アダプテーションを利用して作成した翻訳エンジンを公開することで、他のユーザーがその翻訳エンジンを使用することができます。翻訳エンジンを公開した企業には、使用料の一部が支払われます。なお、翻訳エンジンは匿名で公開することも可能となっています。

■翻訳エンジン診断
翻訳エンジン診断では、翻訳エンジン取引所にて公開されている翻訳エンジンの中から、翻訳したいドキュメントに最適な翻訳エンジンを診断します。対訳との一致率および逆翻訳での原文との一致率から、十印独自のアルゴリズムを利用して計算・評価を行います。

■AUTOMADE(オートメイド)
複数分野の内容で構成されているドキュメントの場合、複数の翻訳エンジンを組み合わせることで精度の高い翻訳が可能になります。AUTOMADE(オートメイド)は、ユーザーがアップロードしたドキュメントに最適なエンジンを、翻訳エンジン取引所内からブロックごとに探して翻訳します。

質の高い機械翻訳なら十印にお任せください

これからの機械翻訳においては、アダプテーションが精度を高めるための1つのキーになるといえます。十印ではすでにアダプテーションを実践しており、実際に高い評価を得ています。

十印では、1980年代前半から本格的に機械翻訳に取り組んできました。現在も、積極的に新しい技術を導入して機械翻訳の精度の向上に努めています。過去の翻訳資産をお持ちの場合、アダプテーションによってどの程度翻訳精度に差が出るかのテストを行うことも可能です。ぜひ十印にご相談ください。

アダプテーションを利用した分野ごとの専用エンジンを提供している十印のAI翻訳「T-tact AN-ZIN®」をお試しになりたい方はこちらまで。

backtotop