2019.12.02

機械翻訳の品質を上げる「プリエディット」とは?その概要とメリットを解説

近年はAIを使った機械翻訳の進歩が目覚ましく、多くの翻訳会社が機械翻訳を取り入れてきています。

しかし、原文が難解な場合などは、想定していた訳文と実際に出てきた訳文とのギャップが生じ、機械翻訳のメリットを思うように得られないケースがあります。

そんなギャップを埋めるために取り入れられているのが、「プリエディット」という手法です。

この記事では、プリエディットとは何か、またそのメリットについて解説します。

プリエディットとは?

プリエディットとは、その名のとおり「翻訳前段階での編集」工程を差します。実際の翻訳アウトプットをより正確なものにできるよう、原文を編集する作業です。

例えば、日本語と英語では、文法体系がまったく違います。日本語には「主語を省略できる」という特徴がありますが、英語では原則として主語を明確にしなければなりません。

こうした言語間のギャップをあらかじめ埋めておくことで、機械翻訳でも正確な翻訳結果を出すことができます。

機械翻訳前にプリエディットをするメリット

機械翻訳は原文をその言葉どおりに翻訳する場合が多く、人間のように行間を読んで情報を補足することは苦手としています。近年では前後のコンテクストから判断して訳語を変えたりする技術が出てきていますが、原文にない情報を訳文に反映することは難しいのです。

例えば、前述の「主語を省く日本語」を機械翻訳にかけると、主語が曖昧なまま翻訳されてしまう可能性が高くなるでしょう。プリエディット工程で日本語原文の主語をすべて明確に記載しておくことで、主語の取り違えを防げるようになります。

なお、プリエディットを行った場合でも、あまりに1文が長い場合には翻訳がうまくいかないケースもあります。プリエディットの段階で文章を短く分けて、主語と述語の位置を近くしておけば、こうした機械翻訳で誤訳が発生するリスクを低減できるでしょう。

プリエディットの手法

一般的には、以下のルールに沿ってプリエディットを行うのがよいとされています。

・1文を短くする
 箇条書きなどを使用し、1文が長くならないように調整します。

・1つの文章に複数の意味が入らないようにする
 主語と述語を明確にします。

・主語や代名詞を明確にする
とくに日本語からの翻訳の場合、「誰が」「何が」といった部分を明確にします。

・表記を統一する
 同じ意味で複数の用語を使用しないようにします。

上記以外にも、使用する機械翻訳エンジンの特性に合わせてプリエディットの内容を調整すると、より効果を高められます。

また、サンプルとして事前に何文かをプリエディットしないで機械翻訳にかけてみるのもよいでしょう。そうすることで、使用する機械翻訳エンジンの特徴を掴むことができるかもしれません。

実際のプリエディットの例

機械翻訳で用いる、実際のプリエディットの例を紹介します。

先述したように、日本語原文を英訳する際のプリエディットでは、「曖昧な表現をなくす」ということが重要です。

「この資料は全部配布しないでください。」という文をGoogle翻訳にかけると、「Please do not distribute this document.」となります。

書き手の意図によっては正しい翻訳となりますが、日本語原文の「全部」がどこに掛かっているのがわかりづらいです。1枚も配布してほしくないのか、一部は配布したいがすべては配布したくないのか、どちらの意味にもとれてしまいます。

意図に応じて、たとえば以下のように書き換えると、思い通りの翻訳結果が得られやすくなります。

1.1枚も配布してほしくない場合
この資料は一枚も配布しないでください。
Please do not distribute this document.

2.全体の一部だけを配布してほしい場合
この資料を一度に全部配布しないでください。
Please do not distribute this document all at once.

「この資料は全部配布しないでください。」という文で翻訳にかけた場合は、Google翻訳が「1枚も配布してほしくない」と判断して英訳してしまうことがわかりました。部分否定の意図で書いている場合は、上記の「2」のように掛かりを明確に表記するとよいでしょう。

機械翻訳を使う場合の理想的な翻訳工程

機械翻訳を取り入れた理想的な翻訳工程は、以下のとおりです。

1. 文章の目的やターゲットを明確にする
2. 「1」の目的やターゲットに沿うように原文を編集(プリエディット)する
3. 編集後の文章を機械翻訳する
4. 翻訳結果が目的や意図に沿っているかを確認し、再編集(ポストエディット)する

***

言語の特性や目的に応じてプリエディット、ポストエディットを行うことで、機械翻訳の効果を最大限に高めることができるでしょう。

実際の意図とは異なる翻訳結果になって修正に手間をかけないためにも、原文の翻訳しやすさを事前にしっかりと確認しておきましょう。

backtotop