GOTCHA!

英語、仕事、勉強。いろんな「わかった!」をお届け。

英文和訳はTOEIC960点レベル、機械翻訳サービスの和文英訳がプロ翻訳者レベルに!

英文和訳はTOEIC960点レベル、機械翻訳サービスの和文英訳がプロ翻訳者レベルに!

株式会社みらい翻訳は、国立研究開発法人情報通信研究機構(NICT)との共同研究により改良したニューラル機械翻訳エンジン*1の日本語・英語間において、TOEIC960点レベルのビジネスマンと同等の翻訳精度を実現しました。また、ニューラル機械翻訳エンジンを搭載した企業向け機械翻訳サービスであるMirai Translator™にも、同エンジンを搭載し提供するとのことです。

プロ翻訳者レベルになった翻訳エンジンの実力は?

今回の翻訳エンジンの改良点は次の通り。

  • ビジネス文章の和文英訳能力がプロの翻訳者に並び、TOEIC960点の日本人ビジネスマンを超える
  • 英文和訳能力はTOEIC960点の日本人ビジネスマンと同等レベルを達成
  • 機械翻訳エンジンによるビジネス文章の翻訳結果の流暢さが日本人ビジネスマンを凌駕

みらい翻訳は2017年12月に法人向けのクラウド機械翻訳サービスMirai Translator™の提供を開始して以来、多くの企業に採用され、利用されています。

働き方改革による業務効率化を求められる中、翻訳などに多く時間を要するビジネスを効率的に進める需要が高まっています。深層学習技術による高精度の機械翻訳の出現で、ビジネスシーンでも機械翻訳が実用レベルになりましたが、さらに高精度の翻訳エンジンを求める声がユーザの皆様より強く寄せられていました。

みらい翻訳はそんなユーザーの要望に応え、日本語・英語間のビジネスコミュニケーションの効率化を支援するため、翻訳精度を更に高めるべく研究開発を重ねているとのことです。

プロの日本人翻訳者と同等の翻訳レベルを実現

みらい翻訳がNICTとの共同研究のもと開発した日英機械翻訳エンジンにおいて、学習データの増量、前処理追加等、日々の継続的な改善の成果により翻訳精度がさらに向上。その結果、ビジネスコミュニケーションや経済系ニュースなどの実務上の文章翻訳において、和文英訳でプロの日本人翻訳者と同等の翻訳結果が得られることが確認できたそうです。

また、同文章でTOEICスコアが920点から960点レベル(ネイティブスピーカーとスムーズにビジネスコミュニケーションできるレベル)を有する日本人ビジネスマンの翻訳結果と機械翻訳結果とを比較したところ、いずれも機械翻訳結果の方が精度が高かったとか。同様に和文英訳の比較を実施したところ、プロの日本人翻訳者には及ばなかったものの、TOEIC960点レベルの日本人ビジネスマンと同等精度の機械翻訳結果が得られました。

また、今回確認できた機械翻訳の特徴として、翻訳文の流暢さ(文章の読みやすさの指標)は、ビジネスマンが翻訳した文章よりも、機械翻訳の結果のほうが優っており、プロ翻訳者に迫る精度とのことです。

人手が介在しない機械翻訳サービスを目指す

すでにMirai Translator™を利用しているユーザからは「翻訳精度が優れており業務に役立つ」とのフィードバックが多数あるそうです。

機械翻訳が既に実用レベルではあるものの、さらに高精度な汎用翻訳エンジンを開発していくとともに、専門分野でニーズが高い分野においても高精度の翻訳エンジンを開発していく予定とのこと。これらにより、ビジネス文章の翻訳実務において、人手が介在しない機械翻訳サービスを実現していくそうです。

翻訳の精度評価結果について

最後に、アップデートを実施したニューラル機械翻訳エンジンの、翻訳処理結果の精度評価結果をご紹介します。ビジネスコミュニケーションおよび経済ニュースなどのビジネス文章を評価文として、日本人ビジネスマンおよび日本人プロ翻訳者の翻訳結果と比較し、人手による評価を行ったそうです。

f:id:eguta:20190426002355j:plain

比較対象>> 1. 日英機械翻訳エンジン(ニューラル機械翻訳)、2. 日本人ビジネスマン(TOEIC900点台のスコアを保有する4名のビジネスマン。辞書使用可)、3. 日本人プロ翻訳者(翻訳を専業としている2名の翻訳者。辞書使用可)

f:id:eguta:20190426002451j:plain

日英機械翻訳エンジンは、TOEIC960点レベルのスコアを有するビジネスマンと同等の翻訳品質を達成

特に日本語から英語の翻訳においては、5段階で4点超と実務で必要な水準を満たしているのみならず、プロ翻訳者と比較しても遜色のない翻訳品質という結果になりました。

また、英語から日本語の翻訳については、プロ翻訳者による日本語としての自然な語順や背景を考慮した翻訳には及ばないないものの、翻訳文自体の流暢さで高い結果を示しています。

精読率*2は、日本語から英語への翻訳処理結果では89.3%、英語から日本語への翻訳処理結果では71.0%となりました。

ビジネスマン、プロ翻訳者とも、翻訳作業には数時間を要するのに対し、機械翻訳エンジンは数分で処理を終了しており、日々の業務効率化に大きく貢献することが期待できそうです。

翻訳の例文はこちら

f:id:eguta:20190426002548j:plain

日本語→英語

f:id:eguta:20190426002611j:plain

英語→日本語

GOTCHA! 編集部

構成:GOTCHA! 編集部

GOTCHA(ガチャ、gάtʃə)は、I GOT YOUから生まれた英語の日常表現。「わかっ た!」「やったぜ!」という意味です。英語や仕事、勉強など、さまざまなテー マで、あなたの毎日に「わかった!」をお届けします。

*1:ニューラル機械翻訳エンジンとは、脳の神経回路を模したニューラルネットワークを用いた機械翻訳技術。膨大な対訳データによりニューラルネットワークを機械学習することで、高精度な翻訳を実現している。

*2:機械翻訳の実用性を確認する評価軸。翻訳結果において、原文の情報がどの程度翻訳処理結果で読み取れるかを5段階で評価し「5」を満点とする。4から5点の文章の総数を文章全体数で割った割合を精読率として明示し、機械翻訳結果がほぼ修正が必要の無い割合を表す。