TAKARA&COグループの企業向け翻訳サービスを行う株式会社十印(本社:東京都港区、代表取締役会長:岡田 竜介、以下 十印)は、国立研究開発法人情報通信研究機構(以下 NICT)から技術供与を受けて開発した商用のAI翻訳サービス「T-tact AN-ZIN」において、PDFファイルの翻訳機能の提供を開始しました。OCR機能も搭載しているため、テキスト抽出ができないスキャンデータや画像中のテキストも翻訳することができます。
また、日本語から直接翻訳できる言語ペアを追加しました。2月にはIT分野に特化したエンジンをリリース予定です。
AI翻訳システムでは通常、テキスト抽出ができるPDFのみテキスト部分を抽出して翻訳してきました。その際、PDFの行末には不要な改行が入るため、翻訳の精度が非常に落ちていました。
T-tact AN-ZINのPDF翻訳機能では、不要な改行を削除した形で一旦Wordファイルに変換し、その後翻訳を行います*1。テキストが抽出できないスキャンデータでも文字の部分をOCR機能でテキストデータに変換し、翻訳を行います。そのため、画像に入っている文字も翻訳が可能です。
*1:ファイルによっては改行削除などのレイアウトを保持できない場合もあります。
図1) T-tact AN-ZINのPDF翻訳イメージ図
* 8MB以内のファイルに限ります。
* 2,000文までの翻訳に限ります。2,000文を超える場合は、Wordへの変換のみ行われますので、2,000文以内に収まるようにファイルを分割し、再度翻訳にかけてください。
* OCR機能は30ページ以内に限ります。
簡単な操作で使用できます。翻訳したいファイルを選択して、OCR機能を使用するかしないかを設定するだけで、Wordファイルに変換された翻訳済のファイルをダウンロードすることができます。OCRを「使用する」に設定していれば、画像の中の文字列もテキスト化して翻訳します。
図2) PDF翻訳の使用画面
今まで日本語から直接翻訳できるのは、英語・中国語簡体字・中国語繁体字・韓国語に限られていましたが、2020年1月14日より、以下の8言語ペアが使用可能になりました。今後も順次言語ペアを追加していきます。
日本語⇔フランス語
日本語⇔ドイツ語
日本語⇔スペイン語
日本語⇔ポルトガル語
日本語⇔タイ語
日本語⇔ベトナム語
日本語⇔インドネシア語
日本語⇔ミャンマー語
ある分野の対訳集を使ってエンジンの深層学習を行うことで、その分野の訳文の精度を上げることができます。その技術を使用して、当社が独自に収集した対訳集でAI学習(アダプテーション)させた分野ごとのエンジンを作成しています。すでに「汎用エンジン」、「特許エンジン」、「特許請求項エンジン」に加えて、AI学習させて作成した「半導体エンジン」をリリースしております。2020年2月にはIT分野に特化したITエンジンをリリース予定です。今後も、各分野に特化したエンジンを搭載していく予定です。
また、この技術を使用することで、分野ごとだけではなく、企業ごとのエンジンを作成することも可能です。ご要望の際はご相談ください。
NICTでは総務省と共に翻訳データを収集し機械翻訳エンジンの精度を高めるためのプロジェクト(翻訳バンクプロジェクト)に取り組んでおり、さまざまな企業からの翻訳データを収集することにより日増しにその精度を高めています。
十印でも、この翻訳バンクプロジェクトに賛同し、独自に作成した対訳データを提供することで機械翻訳エンジンの品質向上に協力しています。T-tact AN-ZINは、NICTからの技術提供を受け、簡単な手続、かつ低価格でビジネスに利用できるようにしたものです。
高いセキュリティ、豊富な便利機能、高精度の翻訳で、ビジネス翻訳に関わる時間を劇的に短縮します。
T-tact AN-ZINの詳細については以下をご参照ください。
よくある質問 https://to-in.com/an-zin_lp
サービスの概要 https://to-in.com/service/mt/an-zin
2週間の無料トライアルを実施しています。ご希望の方は「 mt-strategies@to-in.co.jp 」まで件名に「トライアル希望」としてメールをお送りください。折り返しトライアル登録情報をお送りします。
月額料金の詳細は以下を参照してください。
https://to-in.com/service/mt/an-zin
お客さまの使用状況に応じて最適なプランを設定いたしますので、まずはご相談ください。
メール : mt-strategies@to-in.co.jp
電話番号: 03-6453-6285
担当 : MT事業部 AN-ZIN担当まで
受付時間: 9:00~18:00(月~金:日本時間)