翻訳テクノロジーあれこれ

翻訳生産性向上について思いつくままに書いています

主な翻訳支援ツールの特徴

BABEL eトランス・テクノロジー研究室から翻訳に役に立つテクノロジーの情報をお届けします。
第5回は「主な翻訳支援ツールの特徴」です。

さて、今回から翻訳支援ツール(CATツール)を取り上げて活用方法を取り上げていきたいと思います。
その前に、CATツールの背景を簡単に振り返ってみましょう。

1980年代に入ると、機械可読テキストデータが増大してきました。その中には翻訳による対訳ファイルもあり、翻訳資産として貴重なデータであることが次第に認識されてきました。
やがて、このような対訳ファイルを「翻訳メモリ」や「用語ベース」として活用する技術が登場しました。
1980年代から1990年代にかけてパソコンが普及するに従い、誕生したのが、市販の翻訳支援ツール(CATツール)です。CATツールといえば誰でも思い浮かべるのがTradosでしょう。そのTrados社が設立されたのは1984年で、1991年にはSTAR社がTransitを、1992年にはIBMがTranslation Manager/2を発表すると1990年代後半から2000年代前半にかけて数多くのCATツールが登場しました。
この時代のCATツールメーカーの広告は、「プロの翻訳者はCATツールを使い、アマチュア機械翻訳を使う」というスタンスで差別化を図っていたものです。
これらのCATツールは改良が加えられ、現在でも翻訳生産で中心的に利用されています。
プロの翻訳者はCATツールを使いこなせるのが当たり前だとは言え、新機能がどんどん追加され、肥大化したツールは十分に使いこなすのが難しくなっています。
最近では全体の機能を分割することによって、それぞれの役割の作業者が使いやすいようにしたツールになる傾向が見られます。

CATツールの基本機能

CATツールには色々な機能が搭載されていますが、どのツールにも共通する基本的な機能を押さえておきましょう。

原文のレイアウトを保持して訳す

最も重要な機能は、原文のレイアウトをそのまま保持して翻訳することです。

翻訳する原文としては一部印刷物もありますが、現在はほとんどが電子ファイルです。
CATツールを使わない場合は、原文ファイルに上書きする形で訳文を入力するのが普通です。WordやPowerPointなら問題ないかもしれませんが、Webページの翻訳ならどうでしょうか?

Webページは、HTML(Hyper Text Markup Language)という形式のファイルで、マークアップ、つまりタグの付いたテキストファイルです。

Webページ(HTMLファイル)を代表的なCATツールのTrados Studioで開くと、翻訳すべき文を抽出して、対訳エディタの原文側に表示してくれます。さらに、文末を自動判定してセンテンス単位にセグメント化しています。この状態で右側のセルに訳文を入力します。これならHTMLのタグを気にする必要はありません。

翻訳が終わって訳文を出力すると、原文のレイアウトが保持されています。

翻訳メモリなどの言語資産を活用できる

翻訳に役立つ言語資産としては、対訳データーベース(翻訳メモリ)や用語ベース、そして最近では機械翻訳(MT)などがありますが、これらを一まとめにして検索し、その結果を簡単なキー操作で取り込むことができます。これがCATツールのもう一つの重要な機能です。

クラウドベース翻訳支援ツールのPhrase TMSの編集画面です。
右側のCATペインにTM(翻訳メモリ)、TB(用語ベース)、MT(機械翻訳)の検索結果が表示されています。
これらの検索結果に利用できそうなものがあれば、簡単なキー操作で訳文セルに挿入できます。
また、翻訳が完了して確定すると、その瞬間に対訳が翻訳メモリに保存されて、次から検索対象となります。
蓄積された翻訳メモリは他のプロジェクトでも利用できるので、何度も同じ翻訳を行う手間が省けます。さらに、完全にマッチしなくても、設定した%でマッチすれば表示するようにできます。この場合、どこが違っているのか差分表示されるので、その部分だけ修正すれば訳文が完成します。統一感のある訳文を作成するためにも便利な機能です。

さらに、用語ベースにマッチしたものがあれば、原文の語句が黄色くマーキングされるので、指定訳語のばらつきを防ぐことができます。
TMもTBも、複数の翻訳者が参加するプロジェクトでは不可欠の機能です。

CATツールの種類

CATツールには、大きく分けて2種類あります。

翻訳者の作業効率を向上させることを優先するもの:
例えば、個人の翻訳者に人気のあるOmegaTは無料で使えますが、機能は十分です。
自分だけの言語資産を蓄積して翻訳作業を効率化すには最適のツールです。

翻訳プロジェクトの管理を容易にするプロジェクトマネージャー向けのもの:

クラウドベースのPhrase TMSは、TMS(Translation Management System)という名前の通り、総合的な翻訳管理システムで、そのなかの1機能としてCAT機能を持った翻訳エディタが組み込まれています。
主な特徴は、翻訳メモリや用語集、原文ファイルをクラウドに置いて、共有しながら翻訳できるという点です。
またワークフロー機能を使えば、工程管理やファイルの受け渡しも楽にできます。
プロジェクトマネージャーにとってありがたいツールと言えるでしょう。

CATツールが変化している

従来は、翻訳メモリが中心のツールでしたが、最近では機械翻訳が急速に進化し、CATツールに組み込んで使うことが多くなっています。さらにOpen AIを組み込むCATツールも出始めています。
下図で示された、Trados StudioのOpenAI Translatorプラグイン機能では、複数の訳文を提示し、訳出のポイントや、それぞれの訳文の違いも示してくれます。これまでの機械翻訳より一歩進んだ使い方になっています。

適切なツールを選ぶ

翻訳する内容、形態によって適切なツールを選ぶ必要があります。
大きなドキュメントを均質な文体で翻訳する、小さなファイルが数百もあるプロジェクトを円滑に管理する、個人で対訳データをコツコツ蓄積して効率化を図るなど、現在は目的に応じて選択肢が多くなり、かえってどのツールを選んだらよいか迷ってしまうかもしれません。

翻訳支援ツールは、プロの翻訳者が使うものだけではありません。
一般企業の社員が、日常業務の中で翻訳をしなければならないこともあるでしょう。
そのような用途に向けたサービスも充実してきています。

以下は、ヤラウクゼンというサービスで、複数の機械翻訳エンジンや、フレーズ集(翻訳メモリ)、用語集の機能があり、チェックアシスタント機能を使えば、訳文の修正が効果的に行えます。
 さて、CATツールについて大まかに理解していただけたでしょうか。
次回はCATツールを使った効率的な翻訳手法を取り上げます。お楽しみに。

この記事は動画でもご覧いただけます。

youtu.be

BABEL eトランステクノロジー研究室

https://www.youtube.com/@eTransTechLab

翻訳支援ツールとしてのWord

eトランステクノロジー研究室では、知求翻訳図書館の The Professional Translator に毎月連載している「eトランステクノロジーの世界」の記事を動画にしてお届けしています。

第4回は「翻訳支援ツールとしてのWord」です。

youtu.be

 

さて、プロ翻訳者向けの翻訳支援ツール(CATツール)の説明に進む前に質問です。

皆さんは、翻訳の道具として最も使われているマイクロソフトWordを十分に使いこなしているでしょうか?

Q:編集記号を表示していますか?

Q:「スペルチェックと文章校正」は使っていますか?

この他にも、「形式を選択して貼り付け」「変更履歴の記録」「比較」「目次の作成」「脚注の挿入」「コメントの挿入」など色々あります。使ったことがなければ確認してください。

 

検索とナビゲーション

「検索と置換」のオプション

ワイルドカード検索

Microsoft 翻訳ツール

eトランステクノロジーとは具体的に何か?


<そもそも情報リテラシーとは>

情報リテラシーの要点をまとめると、(1)情報収集、(2)情報整理・加工・分析、(3)情報提示になります。
この項目をざっと見て、翻訳作業と同じことだと思った方もいるのではないでしょうか。

(1)情報収集
翻訳者の仕事では情報収集が大きなウエイトを占めています。
とりわけ「Web検索」は翻訳者にとって最も重要なツールとなっています。
インターネット上の情報は信憑性に問題がないとは言えません。
そのため、情報の真偽を判断する「メディアリテラシー」のスキルも翻訳者には欠かせません。

(2)情報整理・加工・分析
翻訳者にとって収集した情報を整理したり、加工や分析したりすることは翻訳作業全体の工程にとって重要です。
実際の翻訳作業では、原文のワードカウントを行い、どの程度、定型的で繰り返しの多い文書なのか分析し、固有名詞等の調べ物がどの程度必要かを把握し、費用と納期の見積もりを作成するところから始まります。
次に翻訳関連資料から用語集や対訳表現集を作成し、使用するツールに合わせて加工します。
このカテゴリでは、基本的な情報リテラシーと異なり翻訳生産業務そのものを実践するスキルが必要とされるのです。

(3)情報提示
翻訳業務では、納品する訳文そのものが情報提示ということになります。
納品ファイルの標準形式と言えば、MS Wordであり、企業のプレゼン資料やトレーニング資料ではPowerPointが多く使われています。
従って、翻訳者は、少なくともこれらのソフトウェアを十分に使いこなせるスキルを身に付けておく必要があります。

ちなみに、2022年11月に公開されたChatGPTは、いわゆる「Web検索」の概念も大きく変えました。
情報収集のみならず、情報の整理や加工、簡単な分析までしてくれて、指定した形式で出力してくれるという、まさに総合的なツールと言えるでしょう。
まだ、発展途上なので、不備な部分もありますが、今後、急速に改良されていくのはまちがいないでしょう。

さて、このような基本的な情報リテラシーは翻訳者としては当然マスターしているわけですが、現代の高度情報化時代には、これだけでは不十分なのです。
うかうかしていると、いま話題のChatGPTに負かされてしまうかもしれません。

ちなみに、翻訳に関してChatGPTのプロンプトを指定するには、メタ言語の知識が有効です。

メタ言語能力」とは、言語を理解したり認識したりする能力のことです。
これは、言語を使って他の言語について考えたり、議論したり、分析したりする能力を指します。
メタ言語にはいくつかの要素があって、文法ルールや語彙の正確な使用に関する「言語意識」、
自分の言語使用をコントロールして、他人と効果的な意思疎通ができるようにするための「コミュニケーション戦略」、
また、文法や文化的な側面などの「言語学的な要素に対する認識」、
文章を分析し、その構造やスタイル、文脈について洞察を提供する「言語分析」などが挙げられます。
とは言っても、「メタ言語能力」はプロの翻訳者なら誰でも身につけている能力です。
ただし、それを体系的にメタ言語と認識していない人が多いというだけです。
メタ言語を意識的に捉え直すことで、効果的なプロンプトを作ることができ、ChatGPTを十分に活用することができるでしょう。
ChatGPTの活用法については、そのうち詳しく取り上げます。

 

<翻訳支援ツールの重要な役割>

前回も少し触れましたが、翻訳者の作業を効率化するには翻訳支援ツールの使用は避けて通れません。
コンピューターと人間の役割を分担し、それぞれ得意な作業に集中することで無駄な労力を省き、快適な生産環境を整えることができます。
例えば、翻訳のチェックも「QAチェック」を使って第三者の視点で見てもらえます。

翻訳支援ツールも、この数年で大きく変化しています。
最初は、機械翻訳の出力結果があまりにもひどすぎて、翻訳作業に利用できないとして、それに代わって、翻訳メモリと呼ばれる対訳データベースを中心とする翻訳支援ツールが開発され、おもに、ローカライズ翻訳で盛んに利用されるようになりました。
これは現在でも続いています。
しかし、さらに情報爆発が進み、大量・短納期の翻訳を処理するために、色々な工夫がなされるようになってきました。
その中の一つが機械翻訳です。
2016年のニューラル機械翻訳の登場で、格段に品質が良くなり、いまでは自動翻訳とかAI翻訳とか呼ばれることも多くなりました。
従来の翻訳支援ツールが、その機械翻訳と連携して生産性を大いに高めているのです。
今では機械翻訳の出力文を修正する「ポストエディット(後編集)」のテクニックを駆使して飛躍的に生産効率を高めている翻訳者も多くなっています。

<基本的な情報リテラシー+翻訳支援ツールの操作=eトランステクノロジー

さて、バベルでは、このように従来の基本的な情報リテラシーを土台にして、最新の翻訳テクノロジーまで含めた技術を、「eトランステクノロジー」と捉え、翻訳者が身につけておくべきリテラシーであると考えてきました。
翻訳者の養成で大きな実績のあるバベルでは、翻訳力の増強のためのコースだけでなく、eトランステクノロジーを演習する講座を開講し、最新の翻訳テクノロジーに対応できる翻訳者を育てています。https://www.babel-edu.jp/ett-pr/

 

■「翻訳者のための eトランステクノロジー入門」:
翻訳業務に必要な基礎スキルを身につける。

■「eトランステクノロジー活用(OmegaT編)」:
個人で言語資産を活用して翻訳の効率化を図るために、翻訳支援ツールのOmegaTをマスターする。

■「eトランステクノロジー活用(Phrase TMS編)」:
翻訳プロジェクトで活躍するために、翻訳管理システムのPhrase TMSでの翻訳方法を学ぶ。

バベルの翻訳部門であるバベルトランスメディアセンターは、単なる翻訳請負業務に留まらず、常に最新の翻訳テクノロジーを研究し、その知見を実務に応用するとともに、教育部門にもフィードバックしているのです。

今回はここまでです。

次回は、翻訳支援ツールとしての「Word」を取り上げます。お楽しみに。

この記事は動画でもご覧いただけます。
https://www.youtube.com/watch?v=a-yUWz4ByCY&t=7s

================================================
BABEL eトランステクノロジー研究室
https://www.youtube.com/@eTransTechLab

eトランステクノロジーとは何か?

 みなさんは「eトランステクノロジー」とは何かご存じですか。テクノロジーということで何かの技術だということは分かるでしょう、「トランス」からデジタルトランスフォーメーションが頭に浮かんだ方もいるかもしれません。

 

 実は「eトランステクノロジー」はバベルによる造語です。

 バベルでは、2000年頃から、翻訳者のための情報技術を「eトランステクノロジー」と名付けて発展させてきました。

 バベルプレスが発行していた翻訳情報誌・月刊「翻訳の世界」が「eとらんす」に誌名変更したのも2000年7月号からです。

 

 それを遡ること10年前の1990年頃は第1次機械翻訳ブームの真っ最中で、翻訳業界が騒然となっていました。今にも翻訳の仕事がなくなるのではないかと心配する翻訳者もいたくらいです。

 バベルではいち早く機械翻訳システムを導入し、利用方法を研究するために「バベルMTプロジェクト」を立ち上げました。ちなみに、筆者もプロジェクトメンバーの一員でした。それ以来、現在までMTとの付き合いが続いています。

 そして、翌年の10月には、MTプロジェクトの成果をもとに、機械翻訳システムを使いこなせる人材を養成する「MTスペシャリスト養成講座」を開講したのです。

この続きは、「eトランステクノロジー研究室」でご覧ください。
https://youtu.be/0t59RDoub5s
 
元記事は、バベル知求翻訳図書館で読めます
https://babel.co.jp/theme_room/20646/

BABEL eトランステクノロジー研究室 YouTubeチャンネルを開設しました!

YouTubeチャンネルを開設しました!

https://www.youtube.com/channel/UCpwhJgDgTHkwia7EVUvorcg

 

「eトランステクノロジー」はバベルによって造られた言葉で、翻訳者のための情報技術を指します。2000年頃からバベルが発展させてきた概念で、機械翻訳(MT)やコンピュータ支援翻訳(CAT)などのツールやソフトウェアを利用することで、翻訳プロセスの効率と品質を向上させる技術です。

機械翻訳の台頭は、プロの翻訳者に、課題と好機の両方をもたらしました。機械翻訳は、大量のテキストを素早く翻訳することができますが、人間の翻訳者のような、ニュアンスや文化的な理解が欠けていることも少なくありません。とは言っても、機械翻訳に後れを取らないためには、翻訳者は常にスキルを磨き、新しい技術に対応しなければなりません。

このような、急激に進歩するAI翻訳に対応するために、翻訳テクノロジーの利用法を研究しているのが、eトランステクノロジー研究室です。
このeトランス・テクノロジー研究室では、初心者から上級者まで、さまざまな翻訳テクノロジーに関するスキルを身につけたい人たちに有益な情報を提供していきます。

 

ぜひチャンネル登録をお願いします!

ChatGPTに機械翻訳について聞いてみた

今話題のAIチャットシステムを試してみた。

ChatGPT: Optimizing Language Models for Dialogue
https://openai.com/blog/chatgpt/

 

質問: 機械翻訳は人間の翻訳の仕事を奪うのか?

ChatGPT: 機械翻訳は人間の翻訳の仕事を取っているかどうかは議論が分かれています。一部の人は、機械翻訳が人間の翻訳者よりも速く、正確な翻訳を行うことができるため、人間の翻訳者が失う仕事があると考えています。しかし、それに対してもう一部の人は、機械翻訳は文法や文化的なニュアンスを理解することができないため、人間の翻訳者が無くならないと考えています。
現在、機械翻訳はまだ人間の翻訳者に比べて正確さや、文法や文化的なニュアンスの理解力に限界があります。だから、機械翻訳は人間の翻訳者の補助ツールとして使用されることが多いです。

 

私の考えとほとんど同じ。これなら自分で文章を考える必要がなくなってしまうかもしれない。

翻訳者よりもブロガーのほうが危機感が強いかもしれないねー。

 

 

www.babel-edu.jp