
今回はAI翻訳にできること、できないことの違いについて、
お話したいと思います!
特許翻訳、AI翻訳にどこまで任せられる!?
ディープラーニングの登場により、ここ4-5年で劇的に機械翻訳の精度が上がりました。特に定型文が多い契約書や特許文書はAI翻訳の得意としている分野だと言われている。
私たちは翻訳会社であり、特許翻訳を得意としており、今回内製化までして翻訳者を囲い込みました。そこまでした状態で、AIに翻訳の仕事を取られたら大変だと、様々な検証をしてみました。
まず、結論からですが、AI翻訳だけでは不十分です。
これについて、
①AI翻訳の仕組み
②AI翻訳で不十分な理由
③じゃあどうすれば一番良いのか
この3点を簡単にご説明します。
AI翻訳の仕組み
現在のAI翻訳というのは、ディープラーニングを使うようになり劇的な進化を遂げています。ディープラーニングとは、「データとデータをくっつけて、人間が学んでいるようなやり方で、ひたすら学習し、自動的にルールを作るもの」です。
膨大な学習量により、あいまいなものでもルール化できるようになりました。私たちの脳の容量よりはるかに大きく、AIには太刀打ちできません。
ディープラーニングを採用する前は、統計型翻訳というものを使っていました。この違いは下記の図を見ていただいたらわかるように、統計型(以前のタイプ)は、直線的な学習法で、ディープラーニングは何層にも行き来しながらシチュエーションに合わせて数えきれない組み合わせを学習するものであります。
では、実際に統計型とディープラーニングの翻訳を見てみましょう。ちょっとトリッキーな文章です。
英語原文)Yeah, these cookies are free, but I thought you only eat sugar free snack.
- (統計型機械翻訳)うん、これらのクッキーが自由であるけれども、私は、あなたが砂糖不使用軽食をとるだけであると思った
- (ディープラーニング型翻訳)ええ、これらのクッキーは無料ですが、無糖のスナックしか食べないと思いました。
- (人力翻訳)ああ、このクッキーは無料だけど、シュガーレスのおやつしか食べないんじゃないの?
この文章のポイントはfreeという単語。「自由な、無料、~がない」という意味を機械がどう使い分けるか。以前の統計型の翻訳はプラーニングはfreeの使い方を把握しているようで、人間が翻訳するようなものに近づいてきています。
が、sugar free snackを無糖のスナックとしているのに対し、人間はシュガーレスのおやつ、としています。スナックをおやつと言うことなどの微妙な表現はまだAIには難しそうです。
AI翻訳だけで不十分!
AIはしょせん機械です、人間のように意味を理解ですることはできません。つまりAIは文を読んでいるのではなく、確率と統計に基づいてデータ処理をしているだけであるのです。
ある程度までの精度は期待できますが、不完全な文章や、受け手によって感じ方が変わる文章の翻訳は、AIは対応できません。
では、特許翻訳に関して、AI翻訳では大きな間違いが生じる可能性があります。その例を3つ挙げます。
日本語から英語の翻訳です。正しい翻訳は左側です。AIは合っているような気がしますが、このような翻訳になり、全く違う意味になってしまいます。
このように、文面だけ見ていたら、正解のような気がしますが、図で見て頂いたら明らかに意味が全く異なるものになってしまうのです。その結果、強い特許が取れない可能性も出てくるのです。
これは小さな具体例ですが、再度言います。
AIは、文章の内容を理解できないため、外面上は問題なさそうですが、文章の意味を把握したら矛盾が生じてくることが起こります。
内容だけ把握するならAIで十分かも知れませんが、相手に理解させるという場合は、まだ万能ではありません。
AI翻訳の仕組み
現在の翻訳業界では、一から翻訳をすることはあまりなく、AI翻訳(機械翻訳)後、プロの翻訳者が見直す工程を入れるというやり方をとっています。
弊社も同様のやり方をとっています。AI翻訳はだれがやっても同じ結果を出しますが、そのあとの修正が誰がやるかにより、クオリティがかなり変わってきます。
弊社の医療バイオ特許翻訳チームでは、理系出身のネイティブ翻訳者、特許事務所で勤務経験のある翻訳者、アメリカの理系の大学院を卒業した日本人翻訳者、など、専門性の高い人を集め、内製化をして対応しています。
そのため、内容を十分に把握した正しくわかりやすい翻訳を納品することができます。もちろん、AI翻訳を使っているためお安い料金でご提供できます。

万能と思われているAIにもできないことはあります。
うまく使い分けて共存していくことが大切ですね。