翻訳テクノロジーあれこれ

翻訳生産性向上について思いつくままに書いています

連載「eトランステクノロジーの世界」第16回 「NMTとLLMの現状」

チャットGPT登場から翻訳業界に広がる変化

2022年11月、OpenAIがリリースしたチャットGPTが話題を呼び、瞬く間にビジネス、教育、医療、観光など、さまざまな分野で広く使われるようになりました。特に驚きだったのは、単なる会話ツールにとどまらず、翻訳機能までこなせること。従来のGoogle翻訳やDeepLなどの翻訳ツールと比較されるほどの品質があり、「機械翻訳とどっちが優れているの?」といった議論が熱を帯びています。

NMTの進化とその実力

まずは、現代の翻訳を支えるニューラル機械翻訳(NMT)の進化について見てみましょう。長年、機械翻訳は「ルールベース」と「コーパスベース」の段階を経て、今のNMTに到達しています。NMTはエンコーダとデコーダを使って、ある言語をもう一つの言語に変換する仕組みを持っています。これにより、言語間のニュアンスをより自然に表現できるようになり、翻訳の質が向上しました。

LLMがもたらす新しい可能性

一方、大規模言語モデル(LLM)は、NMTとは異なる役割を担っています。LLMは、膨大なデータを使って言語を学習し、文脈を理解した上で自然な文章を生成する能力を持ちます。生成タスクの一部として翻訳も可能ですが、LLMの本来の目的は、翻訳に特化するというよりも、幅広いタスクに対応することです。チャットGPTをはじめとするLLMが翻訳もこなせることで、一般ユーザーにとっては「何でもできる万能ツール」のように感じられているのです。

GPTシリーズの進化:広がる生成能力

GPTシリーズも驚異的な進化を遂げてきました。初期のGPT-1から始まり、2020年のGPT-3では文章生成や質問応答、翻訳、さらにはコード生成まで可能に。そして最新のGPT-4では、さらなる多機能化が進み、テキストだけでなく音声や画像などもリアルタイムで処理できるようになりました。これにより、LLMはさまざまな分野での活用が進み、生成能力と多様なタスク処理が現実のものとなっています。

NMTとLLM、それぞれの強みを使い分ける

NMTとLLMは、同じ翻訳が可能といっても、その目的や役割には大きな違いがあります。NMTは翻訳に特化し、言語変換を重視している一方、LLMは生成能力に重点を置き、幅広い文脈を理解して次の単語を予測していくのが特徴です。どちらが優れているかを一概に決めることは難しいものの、目的や使用シーンに応じて使い分けることが、今後の翻訳作業をより効率的に進めるカギとなるでしょう。

youtu.be

「初心者のための翻訳支援ツールOmegaT活用法」第6回、品質チェック機能

イントロダクションと振り返り: このビデオでは、OmegaTチュートリアルの第6回として品質チェック機能に焦点を当てています。これまでのエピソードでは、OmegaTの紹介、プロジェクト作成、翻訳メモリ、用語集の活用、機械翻訳の連携について取り上げました。

品質チェックの概要: 品質チェック機能について解説し、4つの問題(タグの問題、スペルミス、用語の誤使用、文法や入力ミス)を検出できることが説明されています。品質チェックの実行手順やショートカットキー、表示オプションについても詳しく説明されています。

タグの問題: タグに関連する問題について詳細に説明され、フォーマットのリッチな文書(例:HTML、Microsoft Office)でタグの配置ミスや欠落を検出する方法が紹介されています。

追加のチェックとツール: OmegaTの組み込みのチェック機能は実用的である一方、Xbenchのような他のツールを使ったより包括的な品質保証も推奨されています。特にTMXファイルの翻訳整合性を確認するためにXbenchが使われます。

最終ステップと推奨事項: エラー防止を徹底するために、OmegaTの品質チェック、Xbenchによる翻訳整合性の確認、Wordのエディター機能を組み合わせて使用することが推奨されています。

youtu.be

「初心者のための翻訳支援ツールOmegaT活用法」第5回、機械翻訳の連携

第5回の内容は、OmegaT機械翻訳の連携に焦点を当てており、これまでのエピソードで翻訳メモリや用語集の活用法を紹介したことを振り返りつつ、機械翻訳の利点を説明。
OmegaT機械翻訳機能は、初期の翻訳提案や類似フレーズの一貫性を提供し、翻訳作業を効率化する手助けになることを強調。
OmegaTは外部の機械翻訳エンジン(Google翻訳やDeepLなど)と連携でき、APIキーを設定することで機械翻訳を利用できる。
無料で使える「マイメモリー」という翻訳メモリが紹介され、APIキー不要で手軽に利用できることが説明される。
実際の翻訳プロセスのデモンストレーションが行われ、機械翻訳の結果を参考に編集し、最適な翻訳を作成する方法が具体的に示される。

 

youtu.be

「初心者のための翻訳支援ツールOmegaT活用法」第4回、用語集の活用法

これまでのエピソードでは、OmegaTの基本、プロジェクト作成、翻訳メモリの活用について解説しました。今回のエピソードでは、用語集の活用法に焦点を当てます。用語集は特にビジネス文書で、一貫した翻訳を維持するために不可欠です。
プロジェクト開始時に用語集を準備することが重要です。手作業で用語を確認するのは効率的ではなく、OmegaTのタブ区切り形式の用語集機能を使うことで、翻訳中に自動的に用語が適用されます。
OmegaTでは、右クリックで用語集から選択した訳語を簡単に翻訳に挿入できます。また、翻訳中に新しい用語を追加するのもCtrl+Shift+Gで簡単に行えます。
用語集の用語は視覚的にマークされ、設定で簡単にアクセスできるように調整可能です。部分的に入力しただけで自動候補が表示される機能もあり、翻訳作業が効率化されます。
用語集の追加設定を使えば、空のセグメントに自動的に用語を挿入することも可能です。OmegaTの用語集機能は、翻訳資産を管理し、効果的に活用するための便利なツールです。次回は機械翻訳の活用法を紹介します。

youtu.be

 

「初心者のための翻訳支援ツールOmegaT活用法」第3回、翻訳メモリの活用法

はじめに: このシリーズの第3回では、OmegaTにおける翻訳メモリ(TM)の使い方を解説します。前回までに、OmegaTの紹介とプロジェクト作成方法について説明しました。

 翻訳メモリとは?: 翻訳メモリとは、原文と訳文のペアをデータベース化したもので、翻訳をサポートするために使用されます。ソフトウェアは、このメモリを検索して翻訳の参考になるマッチを提示します。

 OmegaTでのTMの活用方法: OmegaTでは、翻訳メモリの検索結果が「ファジーマッチ」ウィンドウに表示されます。翻訳中に、原文と訳文が保存され、マッチした部分は強調表示されて、簡単に修正できるようになっています。

OmegaTでのTMX形式: OmegaTは、TMXという標準フォーマットを使用して翻訳メモリを保存します。他のツールとの互換性があり、ファイルの変換やインポートが不要です。

プロジェクトワークフローの復習: OmegaTを使った翻訳手順がまとめられています。フォルダ作成、プロジェクト設定、原文の追加、翻訳の入力、ファイルの生成までの流れが振り返られています。

youtu.be

「初心者のための翻訳支援ツールOmegaT活用法」第2回 プロジェクトの作成方法

OmegaTの初心者向け活用法第2回では、翻訳支援ツールOmegaTにおけるプロジェクトの作成方法をステップごとに解説しています。前回の動画を見逃した方は、第1回のビデオも参照してください。
 翻訳支援ツールにおける「プロジェクト」とは、特定の翻訳作業を管理するためのファイルや設定の集まりを指し、複数の翻訳ファイルや設定をまとめて扱うことができます。
OmegaTでの新規プロジェクト作成手順の説明:フォルダの作成、フォルダの選択、言語設定、そしてプロジェクトの保存を行います。
言語設定や分節化のルール、ファイル管理についての詳細な説明。言語コードの指定方法や文単位・段落単位の分節化ルールの設定方法も紹介されています。
OmegaTプロジェクト内の重要なサブフォルダ(翻訳メモリや用語集のフォルダ)の概要と、これらを適切に管理することで翻訳作業を効率化できることを説明。翻訳済みファイルの確認と生成方法を示しています。

youtu.be

初心者のための翻訳支援ツール「OmegaT」の活用法

eトランステクノロジー研究室では、初心者のみための翻訳ツール活用シリーズを始めることにしました。

最初にお届けするのは、「初心者のための翻訳支援ツールOmegaT活用法」です。

ぜひご覧ください。

 

youtu.be