2004年10月号
P58〜P61

翻訳ソフト・試用レポート

シャープ株式会社「翻訳これ一本」
新しいコンセプトの翻訳支援ツール

MT研究会 小室誠一 (http://www.babel.co.jp/mtsg/)

 7月23日にシャープ株式会社「翻訳これ一本 ビジネス・科学技術編 V2」が発売されました。今回のバージョンアップで、「翻訳メモリ」が新たに搭載されています。これまで、「翻訳これ一本」はどちらかというと、英文の斜め読みや英文レターを書くといった、一般ユーザー向けの翻訳ソフトという印象がありましたが、マニュアルの翻訳などで広く使われている翻訳メモリ機能を搭載したというとは業務用翻訳ソフトに一歩近づいたということでしょうか。シャープ株式会社より評価版をお借りできたので、翻訳メモリ機能を中心に早速試してみたいと思います。

専門分野翻訳これ一本 ビジネス・科学技術編 V2


製品紹介ページ
http://www.sharp.co.jp/products/honyaku/ce-s95ej.html

新感覚の翻訳メモリ機能

 「翻訳これ一本」については以前に試用レポートを書きましたが(http://www.babel.co.jp/e_zine/pej5/index.htm)、「おまかせ訳振り」「おたすけ英作」などほとんどの機能はそのままで、翻訳実務にはすこし物足りなかった対訳エディタも特筆すべき機能は追加されていないようです。

 そこで従来の機能は素通りして、新搭載の「翻訳メモリ」機能を一通り試してみましたが、いわゆるローカライズ用の翻訳メモリとはコンセプトがかなり違うという印象をもちました。本来、翻訳メモリツールは用語の統一、文体の統一を主目的に、改訂版の差分を効率よく翻訳するための支援ツールで、今では業務用といわれる翻訳ソフトにもほとんど搭載されています。

 確かに過去の翻訳資産を蓄積していくと、マニュアルのような繰り返しの多い定形化した文章の翻訳でこそ役に立ちますが、これを多様性のあるビジネス文書などの翻訳に応用しようとしても、なかなかうまくいきません。

 「翻訳これ一本」の翻訳メモリは、類似文検索の活用をメインに据えているようです。はじめから完全マッチは期待せず、検索される可能性の高い類似文マッチの場合に、十分に利用できるように工夫されています。それが、非マッチ部自動変換です。これは、自動的に登録されている文例と異なっている部分を翻訳対象の原文の語句と置き換えた上で翻訳し、文例の訳文に埋め込んでくれる画期的な機能です。

 従来の翻訳ソフトにも同じような機能がありましたが、対訳データの登録時に、変動すると思われる語句にあらかじめ手動でタグづけする必要があり、結構手間がかかるため、なかなか使いこなせませんでした。それが「翻訳これ一本」の場合は5箇所までの変動部分を、前準備なしに自動で置き換えてくれるのです。これなら気軽に利用してみようという気になります。

 作業の流れも無駄がありません。対訳エディタに原文を入力して翻訳ボタンをクリックすると完全一致文検索、類似文検索および非マッチ部の自動変換が行われて訳文が出力されます。もし翻訳メモリに一致する文例がない場合は、翻訳エンジンが訳文を出力してくれます。訳文を修正する時は、キーワード検索や、おまかせ訳振り、辞書検索などを簡単な操作で呼び出して利用できます。それぞれの機能がうまく連携されています。

 翻訳メモリの文例は26万対が最初から搭載されているので、使いはじめからキーワード検索がどんどんヒットします。文例は、「ジーニアス英和辞典」「プログレッシブ和英中辞典」などの定評ある中型辞書や実務翻訳者にも愛用されている「ビジネス/技術実用英語辞典 第3版」から収録されていますので安心して利用できます。

実際に翻訳してみます

 さて、それではビジネス翻訳で取り扱うことの多い契約書のサンプルを使って翻訳してみましょう。

 先ず、「E/Jマネージャー」を起動します。数多い機能のほとんどはここにあるツールボタンから呼び出すことができます(図1)

(図1)E/Jマネージャー  【拡大】

 一番左の「E/J」ボタンをクリックすると、英日翻訳に必要なボタンや日英翻訳に必要なボタンだけを表示するように変更できます。

 ここで、左から3番目の「E/J文」ボタンをクリックすると「テキスト翻訳(英日)」が起動し、対訳エディタが表示されます。「ファイル」メニュー⇒「開く」をクリックし、ファイルを選択して原文を取り込みます。ここで、「翻訳」メニュー「全体翻訳」をクリックして訳文を出力します(図2)

(図2)テキスト翻訳(英日)  【拡大】

 行番号1の文は完全一致でセルの背景色がローズ色に、2行目は類似文がマッチして水色になっています。それ以外は翻訳メモリにマッチせず、翻訳エンジンの出力文になっています。このように実際には、ほとんど翻訳メモリにマッチしないのが普通だと思ってください。

 それでは次に、類似文がマッチした2行目のセルを選択して「翻訳メモリ呼出」ボタンをクリックし、「翻訳メモリ」ウインドウを開いてみましょう(図3)

(図3)翻訳メモリ  【拡大】

 類似文の表示ウインドウでは、@原文(翻訳対象文)、A類似文マッチした文例の原文、B文例の訳文、C文例と異なる部分が置換されたもの(この場合は削除)、D最終的な訳文が表示されます。つまり、「Terms and Conditions」を検索したら「general terms and condition(一般取引条件)」という文例にマッチし、余分な「general」の訳語が削除され最終的に「取引条件」という訳文が出力されたというわけです。

 このサンプルだと非マッチ部置換がわかりにくいので(図4)の例を見てください。原文「This tower was struck by lightning last month.」に対して、翻訳エンジンによる訳文は「このタワーは、先月の電光によって打たれた。」となっています。これはこれで意味の通る訳文ですが、いかにも直訳です。類似文検索によって「This tree was struck by lightning last week.(この木は先週落雷にやられた。)」が表示されています。さらに、文例の訳文+非マッチ部変換で「このtowerはlast month落雷にやられた。」のように相違部分が原文の単語に置換されているのがわかります。さらにこの原文部分が訳出されて訳文に埋め込まれ、最終的に「この塔は先月落雷にやられた。」となっています。

(図4)非マッチ部置換のサンプル  【拡大】

 さて、検索した結果、マッチする文例がないと翻訳エンジンが訳文を出力します。試しに行番号3を選択して「翻訳メモリ呼び出し」ボタンをクリックすると、翻訳メモリ・ウインドウが開くと同時に自動的にキーワード抽出検索が行われます。それぞれの語句の出現頻度をもとにキーワードを抽出し、それらのキーワードで文例を複合検索し、結果を一覧表示してくれます。キーワードの一覧から任意のキーワードをクリックすると左側のウインドウに検索結果が表示されます(図5)。ここでは、「reverse side」に対する用例を見ることによって「裏」「裏面」「逆の面」などといった訳語を得ることができます。

(図5)キーワード抽出検索  【拡大】

 さらに原文の辞書引きを一括で行いたい時は、「おまかせ訳振り」を利用します。対訳エディタから辞書引きしたい原文を選択して「おまかせ訳振呼出」ボタンをクリックするとおまかせ訳振りウインドウが開きます。原文が自動的に取り込まれて、設定レベルに応じて原文の下に訳語が表示されます(図6)。レベルは12段階に分かれていて、ユーザーの好みで切り替えられます。

(図6)おまかせ訳振り  【拡大】

 この「おまかせ訳振り」が他の辞書引き機能と異なるのは、原文の品詞解析を行った上で訳語を選択することです。英語は同じ見出し語でもいくつも品詞があることが多く、適切な訳語を見つけるのが結構むずかしいのですが、この機能を使えば簡単です。

 「おまかせ訳振り」の辞書引き結果は「単語帳連携機能」を使って一括でMy単語帳に保存することができます。さらにMy単語帳には「タブ区切りテキストにエクスポート」する機能があるのでいろいろと活用できます(図7)

(図7)My単語帳  【拡大】

 いかがでしょうか。作業の流れに無駄がないようにそれぞれの機能がうまく連携されているのが少しは実感していただけたと思います。なお、ここでは英日翻訳を試しましたが、日英翻訳でも同じように利用できます。むしろ、英文作成の方が役に立つかもしれません。

対訳ファイル登録方法

 翻訳メモリには26万文例が最初から搭載されていますが、もちろんユーザーが任意の文例を登録することができます。翻訳しながら、完成するたびに一文ずつ登録して行くこともできますが、手元に対訳ファイルがあれば一括でインポートできます。ただし、インポートの際に検索キーワードの自動抽出を行うためにかなり時間がかかります。試しに約8000文例のファイルをインポートしてみましたが、画面が止まったまま処理状況も表示されないのでフリーズしたのかと思っていたところ小一時間して無事終了しました。小分けにしてインポートしたほうが良いでしょう。

 インポートのファイル形式は上下対訳形式か翻訳メモリの標準互換形式のTMX形式です。上下対訳形式は「テキスト翻訳」の保存形式ですが、テキスト・エディタなどでも簡単に作成できます。TMX形式はTRADOSなどの翻訳メモリツールやPC-Transerなどの業務用翻訳ソフトの多くがサポートしていますので翻訳資産を十分に活用できます。

 また、翻訳メモリは構造上、「個人用」「共有用」に分けられ、どちらに登録するか選択できます。共有用メモリを共有設定することで複数の利用者が同じメモリを使用することができます。

ユーザー辞書について

 最後にユーザー辞書機能も見ておきましょう。「翻訳これ一本」のユーザー辞書は、「お手軽ユーザー辞書」という名前が表しているように、名詞の登録と原文のまま出力させる語句の登録だけであり、決して充実しているとはいえません。しかし、これはこのソフトのコンセプトに基づく仕様だと思われます。高機能なユーザー辞書ツールを搭載しても一般ユーザーはほとんど利用しません。せいぜい固有名詞を登録するぐらいです。がんばって登録しても品詞をまちがえたりすると、翻訳品質そのものに影響がでることもあります。そこで、一番無難で利用頻度の高い名詞の登録だけユーザーに開放しているのでしょう。

 それでも、一括登録の操作は非常に簡単です。「お手軽ユーザー辞書」のウインドウを開いておいて、「手作り用のユーザー辞書」に対訳リストのファイルをドラッグ・アンド・ドロップするだけです(図8)

(図8)お手軽ユーザ辞書  【拡大】

 製品名などで翻訳せずに英語のまま出力する場合は、「自動抽出用のユーザー辞書」に、英単語交じりの日本語文書ファイルをドラッグ・アンド・ドロップすると、英語の単語を自動的に抽出して取り込んでくれます。訳語の確定していない単語などもこのリストに追加して、とりあえず翻訳を進めておいて、最終段階で検索置換するというような使い方も考えられます。

 「お手軽ユーザー辞書」で注目しておきたいのは「ユーザー辞書共通フォーマット」のインポートに対応していることです。これはアジア太平洋機械翻訳協会(AAMT) が開発した機械翻訳ソフトウェアのユーザー辞書)を、互いに共通利用できるしくみです。これにより他の翻訳ソフトで作成したユーザー辞書を利用することができます。

 さて、翻訳メモリ機能を中心に最新バージョンの「翻訳これ一本」を試用してみましたが、対訳エディタや辞書機能などは、業務用翻訳ソフトとして翻訳者が実務で使用するのには少し物足りない気がします。厳密に訳語や文体の統一を行いながら定型的な文章を翻訳するというよりは、文例や辞書引きを活用しながら、ニュアンスに富む文章を翻訳するのに向いているようです。ただし、まだまだ、翻訳メモリ機能は改良すべき点があります。例えば、類似文検索で非マッチ部の認識がされなかったり、訳文が置換されなかったりします。それでも、次々と表示される検索結果は、中には的外れなものもありますが思わぬ発見もあって興味が尽きません。一度試してみる価値はあるでしょう。
 全体の印象として、「翻訳これ一本 ビジネス・科学技術編 V2」は機械翻訳と電子辞書を、翻訳メモリを中心に融合した新しいコンセプトの翻訳支援ツールと言えます。

Copyrightc 2004 Babel K.K. All Rights Reserved.

バックナンバーのお求めは、インターネット・ショップ「e-翻訳堂書店」へ
e-翻訳堂書店

Global Knowledge Garden  BABEL UNIVER-City  MT(機械翻訳)研究会