画像内テキストの翻訳も可能!十印の「PDF翻訳機能」
取引先から送られてきた外国語のPDFファイルを翻訳したい、あるいは自社で作成したPDFファイルを他の言語に翻訳したい、という場合は多いのではないかと思います。十印では、そのような場合に役立つPDF翻訳機能の提供を開始しました。ここでは十印のAI翻訳サービス「T-tact AN-ZIN」に搭載されているPDF翻訳機能についてご紹介するので、ぜひ利用を検討してみてください。
PDF翻訳機能とは
従来の機械翻訳でPDFファイルを翻訳する場合、テキスト部分のみを抽出して翻訳するのが一般的でした。しかし、PDFファイルにはテキストを抽出できないスキャンデータや画像データが利用されていることも多くあります。このようなデータの中に多くのテキストが含まれている場合、翻訳できないと情報量が大幅に少なくなってしまいます。
この機械翻訳の欠点をカバーするために、「T-tact AN-ZIN」のPDF翻訳機能ではOCR機能を導入しました。OCR機能とは、画像に対して文字認識処理を行う機能のことです。これを用いることによって、直接抽出したテキストと同様に画像内のテキストを翻訳することができます。
さらに、PDFファイルのテキストは行末に改行が入っており、何の処理もせずに翻訳すると精度が著しく低下してしまうという問題点がありました。これを解決するために、「T-tact AN-ZIN」のPDF翻訳機能では一度Wordファイルに変換してから翻訳を行います。スキャンデータや画像データ内のテキストを翻訳できることに加え、翻訳そのものの精度もアップしたといえます。
「T-tact AN-ZIN」のPDF翻訳機能のメリット
PDFファイルを翻訳するにあたって、どのようなサービスを利用するかで迷っている方もいらっしゃるかもしれません。ここでは、「T-tact AN-ZIN」のPDF翻訳機能のメリットについてまとめました。
OCR機能の導入
PDFファイルを翻訳するサービスはいくつかあり、Google翻訳などはその代表例だといえます。しかし、Google翻訳などのサービスにはOCR機能はありません。翻訳したいPDFファイル内にスキャンデータや画像データがある場合には、GoogleドライブなどのOCR機能を利用してテキストを読み取り、そのうえで翻訳させる必要があります。このような手間を省けることは、「T-tact AN-ZIN」のPDF翻訳機能の大きなメリットだといえるでしょう。
簡単な操作方法
「T-tact AN-ZIN」のPDF翻訳機能の使い方は、非常に簡単です。翻訳したいファイルを選択し、OCR機能を使用するかの設定を行うだけなので、初めて利用する場合でもスムーズに翻訳を行うことができます。機能の利用に伴う煩わしさがないので、社内でもすぐに定着するのではないでしょうか。
翻訳できる言語の追加
以前であれば、日本語から、あるいは日本語に直接翻訳できる言語は英語、中国語簡体字、中国語繁体字、韓国語の4言語のみでした。しかし、2020年1月14日以降はフランス語、ドイツ語、スペイン語、ポルトガル語、タイ語、ベトナム語、インドネシア語、ミャンマー語も翻訳可能となりました。今後も言語ペアは追加する予定で、より多くの言語での翻訳ができるようになります。
訳文の精度の向上
翻訳の精度を向上させるために、それぞれの分野の対訳集を用いてエンジンの深層学習を行っています。十印が独自に作成している対訳集には、汎用エンジン、特許エンジン、特許請求項エンジン、半導体エンジンがあり、2020年2月にはITエンジンもリリース予定です。
なお、同様の技術を用いることで企業ごとのエンジンの作成も可能です。企業に特化したエンジンを作成することでより、質の高い安定した翻訳が期待できます。継続してサービスを利用する場合には、エンジンを作成するメリットは大きいといえるのではないでしょうか。
分かりやすい料金体系
PDF翻訳機能は、十印がNICT(国立研究開発法人情報通信研究機構)の技術供与を受けて開発した「T-tact AN-ZIN」という機械翻訳サービスに含まれています。T-tact AN-ZINのプランは、大きく企業向けプランと個人向けプランの2つに分かれています。
企業向けプランには「Silver」、「Gold」、「Platinum」の3つがあり、Silverは月額料金2,000円で月に50万文字までの翻訳が可能となっています。Goldは月額料金40,000円、Platinumは100,000円で、月間制限文字数はそれぞれ300万文字と1,000万文字です。ユーザー数は無制限なので、社内で広く共有して利用できます。
個人向けプランはGreenと呼ばれており、月額料金は5,000円、月間制限文字数は10万文字です。10万文字はA4用紙100ページ相当なので、個人利用であれば十分な量なのではないでしょうか。
***
十印では、T-tact AN-ZINの2週間の無料トライアルを実施しています。サービスを利用するか迷っているのであれば、まずは無料トライアルを試してみてください。
1980年代以降、十印では「言語研究所」を設立し、日本初の機械翻訳プロジェクトであるMuプロジェクトにかかわってきました。現在の機械翻訳は以前の機械翻訳とは大きく異なり、高いレベルでの翻訳が期待できます。翻訳の質やコストについて悩みをかかえている場合には、ぜひ気軽に十印までご相談ください。