2019.10.28

AI翻訳の質は原文が重要?プリエディットについて徹底解説!

近年は、Google翻訳をはじめとするAI翻訳の精度が急速に高まっています。AI翻訳は、手軽に翻訳することができ、作業の効率化が見込めるのがメリットですが、いざ翻訳をしてみると思うように翻訳されていないこともあります。

そこで、AI翻訳を導入する際は、機械が翻訳しやすくするために、原文をリライトする作業である「プリエディット」を行うことをおすすめします。事前にプリエディットをすることで、翻訳しやすくなるだけではなく、仕上がりの品質向上にも繋がります。

そこで今回は、AI翻訳が翻訳しやすい文章の作り方、プリエディットについて解説していきます。

プリエディットとは?

プリエディットとは、機械が翻訳しやすいように原文をリライトする作業を指します。

翻訳をする際には、原文の内容を正しく理解する必要があります。人手による翻訳の場合は、主語が多少抜けていても前後から文脈を読み取ることは可能ですが、機械の場合はそこまで柔軟に対応することはできないため、翻訳物の品質が下がってしまう可能性があります。複数言語に翻訳する際は、機械に正しく理解されないと、翻訳されたすべての言語に誤訳がうまれ、修正に大幅な工数がかかってしまうことでしょう。

そこで、AI翻訳の場合は、特に翻訳しやすいように、事前に原文を分かりやすく修正しておくことが大切です。あらかじめプリエディットを行うことで、複数言語の場合でも翻訳の修正が大幅に減る可能性が高いため、効率化につながります。

プリエディットのやり方

まずは、言語ごとの違いを知ることで、AI翻訳を効率的に使うことができます。ここでは、日本語と英語を例に解説します。

日本語 英語
表現 全体的にあいまいで明言を避ける 直接的で断定的
文の長さ 長い 短く簡潔
主語 省略する 省略しない
省略語 多い 少ない
結論を述べる 最後 最初

【日英のポイント】
● できるだけ簡潔にする
● 断定的な文章を書く(あいまいにしない)
● 言葉を省略しない
● 正確な文章を書く

次に、人の手による翻訳と機械による翻訳の違いも知っておきましょう。

人間の翻訳 機械翻訳
行間を読む できる できない
文脈から省略を補う できる できない
原文の誤字脱字 翻訳できる 翻訳できない

プリエディットをする際は、上記のような特徴をおさえた上で、AI翻訳しやすいように文章を書き換えます。

ここからは、機械が翻訳しやすい文章を作るプリエディットのやり方を解説します。

・略語は省略しない
略語は省略せずに記入します。

知財部 → 知的財産部
セレブ → セレブリティ

頻繁に登場する略語は、ユーザー辞書に登録すると便利です。

・省略を補う
省略されている主語、目的語、動詞を補うことで、誤訳を防ぐことにつながります。

例)
ご意見をお聞かせください。 → あなたのご意見をお聞かせください。

・なるべく漢字を使う
ひらがなが多い場合、単語の切れ目が分かりづらいので、なるべく漢字にしましょう。
例)
ここではいの検査を受けてください。
  ↓
ここでは 胃(い) の検査を受けてください。
ここで 肺(はい) の検査を受けてください。

本来漢字に変換すべきところがひらがなのまま、というミスは起こりやすい傾向にあります。細かい部分ではありますが、間違いなく修正する必要があります。

・同音異義語の漢字変換
同音異義語の場合、漢字を誤るとAI翻訳では、そのまま訳されてしまいます。
漢字の誤りがないか確認してみてください。
例)
原文             訳文
修正前 お金を振り返る    I look back on money.
修正後 お金を振り替える。 I change money.

原文         訳文
修正前 絶対絶命 The absolute end of life
修正後 絶体絶命 A desperate situation

・文章を短くする
日本語では1文に複数の内容がありますが、英語は原則、1文にはひとつの内容を書きます。
文章を短くしてできるだけ簡潔に書きましょう。

例)
アメリカのメジャーリーグで活躍する日本人はたくさんいるが、中でも注目を集めているのがヤンキースの松井秀喜だ。
  ↓
アメリカのメジャーリーグで活躍する日本人はたくさんいる。中でも注目を集めているのがヤンキースの松井秀喜だ。

・具体的な動詞を使う
「~になる」「~を行う」「~する」といった動詞は避けて、限定的な意味の動詞を使います。
例:
信号が赤になる。 → 信号が赤に変わる。
継続調査を行う。 → 継続的に調査する。
私はコーヒーにします。 → 私にはコーヒーをください。

・適切な助詞を使う
「てにをは」に気をつけると、翻訳精度が上がります。
「象は鼻が長い」の「は」のように、主格を表さない「は」、「彼女のいなくなった後」の「の」のように、主格を表す「の」には注意してください。

例)
最近のゲーム機は操作が難しい。→ 最近のゲーム機の操作は難しい。

・無生物主語を使う
英語では無生物主語がよく見られますので、無生物主語に書き換えることで、翻訳の質を上げることにつながります。

例)
このシステムによって、作業効率が大幅に改善しました。
  ↓
このシステムは作業効率を大幅に改善しました。

***
原文の品質が悪いままAI翻訳を使うと、仕上がりの品質が下がり、修正作業に時間がかかってしまいます。

「プリエディット」をすることで効率化とコスト削減に繋がるので、ぜひ実践してみください。実用レベルの翻訳を求める方は、翻訳会社に在籍しているプロの翻訳者に依頼することをおすすめします。

株式会社十印では、プリエディットだけではなく、日本語の翻訳に特化したNICTのエンジンを採用した製品を販売しております。翻訳に関するあらゆることは、ぜひ当社にご相談ください。

NICTエンジンを使用したAI翻訳サービス「T-tact AN-ZIN」はこちら

backtotop