2019.09.30

AI・機械翻訳の精度を上げるコツは?AI翻訳に適した文章の作り方

今回は、日本語から英語などの他言語にAI翻訳するときのコツをご紹介いたします。日本語は他言語と比べて独特な文法構造を持ち、英語からスペイン語、中国語から英語の翻訳のように簡単にはいきません。

しかしコツさえ掴めば精度の向上は可能です。まずは、原文作りの基本的なポイントから解説していきます。

原文制作のポイント~基礎編~

原文の制作時に気をつけたい基本的なポイントをいくつかご紹介します。ただ、ポイントに注意して作文するあまり、本来の意図から外れてしまってはいけません。AI翻訳を使用する場合に、気に留めておくことで、誤訳の少ない訳文ができあがるポイントを解説します。

① 長文を避ける
日ごろから作文に慣れている方、あるいは作文が上手な方は、短文での文章作りを心がけているのではないでしょうか。原文の制作時にも、なるべく短文を心がけることで、誤訳を未然に防げます。

② 誰が(何が)、何を、どうした。に気をつけて作文する
特に英語は、主語を重視する言語です。明確な主語を入れて作文することで自然な英訳を目指しましょう。また、「何を」の目的語の部分も日本語では省略しがちなので、意識して入れるようにしましょう。

③ 同音の「かな」を避ける
例えば、「たけ」というかな文字の場合「竹=bamboo」と「丈=length」といった解釈があり、誤訳を招きかねません。また、動詞の場合でも同じように、「冷める」と「醒める」や、「測る」と「図る」のような場合も注意が必要です。

このように同音の仮名でいくつかの解釈があるような場合には、できるだけ漢字を使って意味を限定することで、より正確に目的の訳文を導くことができます。

④ 慣用的な表現について
「目に浮かぶ」「耳が痛い」などの慣用表現は機械翻訳の苦手とするところです。極力避けるように作文することをおすすめします。また慣用句と同様にことわざについても機械翻訳とは相性が良くありません。

例えば、「馬の耳に念仏」や「隣の芝生は青い」をGoogle翻訳しても、
「Nembutsu in the ear of a horse」と「The grass next to it is blue」という結果になります。英語で相当するような慣用句には翻訳されません。また、4文字熟語のGoogle翻訳については下記のような結果が示されます。

「絶体絶命=desperate situation」
「完全無欠=Perfection」
「一石二鳥=One stone two birds」次候補「kill two birds with one stone」
「海千山千=Umi Chisen」次候補「sly old dog」

ニューラル機械翻訳の成果なのか、「一石二鳥」は、類推される英語の慣用句ではありませんが、語句として表示されます。しかし、「海千山千」に関しては意味不明な訳文となってしまっていますが、次候補には英語の慣用句となっており、まずまずの結果といえるでしょう。

原文制作のポイント~応用編~

続いては、AI翻訳のための原文づくりのポイントの応用編を解説していきます。前述した基礎的なことに加え、次に解説する応用編を抑えることで翻訳の精度を大きく上げることができるでしょう。

高精度で効率的に翻訳を行うためにも、ぜひ覚えておきたい部分です。

① 主語の使い方
例えば、「彼はその味で母を思い出した。」
という文章の場合を考えてみます。こちらをGoogle翻訳すると

「He remembered mother with that taste.」

となりますが、英語的にはややおかしく体裁が悪いです。英語的にはこちらのほうが違和感を受けることはないでしょう。

「その味は彼に母を思い出させた。」

「That taste reminded him of mother. 」

と主語を彼からその味に変えて原文を書きます。

さらに、彼が思い出した母は、彼の母ということを日本語の文脈上においてはあえて「彼の母」と言及する必要はありません。一方で英語においてはそれが必要になります。

したがって原文は「その味は彼に彼の母を思い出させた。」となります。

口語としてはやや硬い表現になってしまっていますが、正確な翻訳を行うには上記のような原文である必要があるケースも多いです。

このような原文を作るためには、上記の例で言うと「『彼の母』の『彼の』という部分を日本語の場合は言及する必要はないが、英語の場合は必ず必要になる」といったことなど、日本語と英語の文法の違いなどをそれなりに把握しておかなくてはなりません。

そのため、きれいな翻訳にするためにも、ある程度英語の感覚が必要になってくるのです。日頃から英語に慣れ親しんでいるようであれば、原文作成の際の応用力にも期待できそうです。

② 簡潔な動詞の使い方
次に気をつけたいポイントとして、動詞の使い方があります。例えば動名詞+動詞を使っているようなとき、「疲労することに慣れる」「食べることに飽きる」といった場合は、「疲労に慣れる」「食べ飽きる」といったように一つの動詞にまとめて作文するほうがベターです。

ただし、「待つことに疲れる」→「待ちくたびれる」などの言い回しにはまだまだ対応していません。そのため、何でもかんでも減らせばいいということでもないので注意が必要です。

③ 明確な時制の使い方
時制を明らかにして、現在、過去、未来のいつのことを書いているのかをはっきりさせましょう。例えば「いつまでたっても船はこない」という場合、「いつまでたっても船はこないだろう」などと「だろう=will」をつけてみるといいかもしれません。

文脈や、前後関係を考慮して、未来を言及する「だろう=will」が必要かどうか、事前の判断が大切です。

④ 敬語の使い方
日本語の敬語(尊敬語・謙譲語・丁寧語)、例えば目上に対して使う「ご機嫌いかがでしょうか」はAI翻訳すると「How are you ?」になります。英語にも自分と相手との距離感で言い方を変えることはありますが、社会的な立場や上下関係に関する言い回しは日本ほど多くありません。

同様に「先輩! ありがとうございます」の「先輩」や、「〇〇ちゃんママ」といった言葉もできるだけ、避けたほうが流暢な訳文になります。

⑤ 固有名詞の使い方
例えば、複数の具材が入った大型のユニークなおにぎりで「爆弾おにぎり」があります。この場合、翻訳すると「Bomb rice ball」と訳され、複数の具材が入って大きいおにぎりのユニークさが希薄になってしまいます。このような固有名詞もできるだけアルファベット表記しましょう。

⑥ オノマトペについて
「カキーンと打つ」「ざわざわする」などのオノマトペも避けましょう。また同様に、「コケコッコー」や、「メーメー鳴く」といった擬音語も避けたほうが無難です。

以上が原文作成時に注意したいポイントです。このような作業を丸々プレエディット(=原文のリライト)という形で外注する選択肢もあります。業務上で翻訳サービスが必要になっているけれど時間がないといった方はぜひ検討することをおすすめします。

***

AI翻訳の精度は上がっているとはいえ、私たちが日常で使う話し言葉を意のままに翻訳してくれるのはもう少し先の話になりそうです。人による翻訳よりも短時間で翻訳できるAI翻訳をより有効活用するためにも、正しい原文の作成方法を覚えておきましょう。

十印のAI翻訳サービスについてはこちら

backtotop