十印のAI翻訳「T-tact AN-ZIN®」の翻訳精度が大幅に向上!その理由とは?
十印では、1980年代から本格的に機械翻訳の研究開発に協力してきており、機械翻訳導入に関する長い経験があります。2016年に深層学習を取り入れることで、AI翻訳は急激に性能を向上させました。2020年4月には十印でリリースしているAI翻訳「T-tact AN-ZIN®」の翻訳精度がさらに向上しましたので、T-tact AN-ZIN®の特徴や品質検証結果についてご紹介します。
AI翻訳「T-tact AN-ZIN®」とは
T-tact AN-ZIN®は十印で提供している商用の機械翻訳ツールで、国立研究開発法人情報通信研究機構(NICT)が開発した翻訳エンジンを低価格でご利用いただくことがきます。NICTは、総務省と協力して行政機関や民間団体から多くの翻訳データを収集することによって翻訳エンジンの質の向上を目指しています。十印でもこの「翻訳バンク」構想に協力しており、機械翻訳の品質向上に取り組んでいます。
T-tact AN-ZIN®の特徴
T-tact AN-ZIN®は、翻訳したいドキュメントを指定するだけで即座に翻訳ができるので、機械翻訳システムを使ったことがないという方にも簡単にご利用いただけます。その翻訳の質はTOEIC900点以上のレベルだといわれています。また、Microsoft Officeのプラグインが用意されており、Word、Excel、PowerPointの上で直接に必要な箇所の翻訳ができるのも大きなメリットです。
セキュリティ面でも安心してご利用いただけます。無料翻訳ソフトなどでは、翻訳データを品質向上などの目的として翻訳データが使用されることがありますが、T-tact AN-ZIN ®では、利用者の許可無く使用することはありません。IPアドレス制限も設けているため、企業外での使用に制限を掛けることができます。
ユーザーIDが無制限で企業内で何人でもご利用いただくことができるので、気兼ねなく安心して使用することができます。
T-tact AN-ZIN®の翻訳精度が大幅に向上
機械翻訳の精度はニューラル機械翻訳(NMT)の登場によって飛躍的に向上しました。このNMTの学習モデルに「Transformer」方式を採用した第二世代エンジンを搭載することで、T-tact AN-ZIN®の翻訳精度の更なる向上に成功しました。
■従来モデルとTransformerモデルの比較
従来のT-tact AN-ZIN®とTransformerモデルにアップデートしたT-tact AN-ZIN®の翻訳を比較した例文をご紹介します。
【原文】 | TOIN will be reviewing not only its translation quality, but also all of its processes company-wide, starting from its upstream processes. |
---|---|
【第一世代エンジンの翻訳】 | TOINは、翻訳の質だけでなく、上流プロセスからのプロセスを始めとするすべてのプロセス企業のプロセスをレビューしていきます。 |
【第二世代エンジンの翻訳】 | TOINでは、翻訳品質だけでなく、上流工程から全社の全工程を見直していきます。 |
【人間による翻訳】 | 十印では、翻訳品質にとどまらず、上流工程からの全社的プロセスの見直しを行います。 |
この翻訳例から、TransformerモデルのT-tact AN-ZIN®の翻訳は第1世代エンジンの翻訳に比べて非常に日本語が自然であることが分かります。人間による翻訳とも大きな相違はなく、質の向上は明らかだといえるでしょう。
■TransformerモデルエンジンのBLEUスコアでの品質検証結果
機械翻訳の品質評価方法はいくつかありますが、その中でも最もよく使われるのがBLEUスコアです。BLEUスコアは機械翻訳結果と人間が作成した参照訳を比較することによって算出され、数値が高ければ高いほど品質が高いとされています。
英日英文和訳における従来のT-tact AN-ZIN®のBLEUスコアは34でした。それに対し、TransformerモデルのT-tact AN-ZIN®ではBLEUスコアが40までアップしました。Googleの指標では、40以上は「高品質な翻訳」と言われています(BLEU スコアの解釈)。翻訳アップデートによって、それだけ人間の翻訳に近くなったといえます。
■Transformerモデルエンジンの翻訳者による品質検証結果
翻訳者による品質評価においても、各分野において品質が上がったと評価されました。ビジネス文書の英文和訳ではそのまま使用できる自然な文面になっており、和文英訳においても誤訳が減少しました。取扱説明書や仕様書の英文和訳も自然な日本語となり、和文英訳でも品質向上が認められました。
そして、最も大幅な品質の向上が見られたのがマーケティング文書です。マーケティング文書は一般的に機械翻訳が苦手とする分野だといわれていますが、英文和訳では分かりやすい流暢な日本語になっている、和文英訳においては多少修正を加えることで正式文書として利用できると評価されました。
■言語ペアと金融分野エンジンの追加
従来モデルのT-tact AN-ZIN®の特許翻訳エンジンに、英語とドイツ語の言語ペアが追加されました。また、2020年7月にはTransformerモデルへの金融分野エンジンの追加を予定しています。これにより、さらにT-tact AN-ZIN®が対応できる幅がさらに広がりました。今後もさまざまな分野のエンジンを追加していく予定です。
Transformerモデルにおいて使用できる分野と言語ペアは、以下の通りになっています。(2020年6月現在)
【汎用】 |
日本語―英語 日本語―中国簡体字 日本語―中国繁体字 |
---|---|
【特許】 |
日本語―英語 日本語―中国簡体字 日本語―中国繁体字 |
【金融】 | 日本語―英語(2020年7月以降予定) |
AI翻訳ツールの導入をお考えの際には十印にご相談を
T-tact AN-ZIN®では、クラウド版とオンプレミス版の2種類からお選びいただけます。また企業様向けには「Silver」、「Gold」、「Platinum」の3つのプラン、個人向けには「Green」をご用意しています。用途に応じて適切なプランをお選びいただくことができます。14日間の無料トライアルを実施していますので、高品質な翻訳を是非お試しください。
十印では、半世紀にわたって翻訳に関するノウハウを培ってきました。機械翻訳導入の際にも、用語集や過去の翻訳資産を活かす方法、機械翻訳に適切な原文の作り方など、翻訳に関わる運用方法を支援いたします。AI翻訳導入をお考えの際はご相談ください。