翻訳ソフト実践ワークショップ

第2回 辞書機能

翻訳ソフトの訳文品質向上に最も効果的なのは辞書のカスタマイズです。今回は辞書の種類とその役割、そしてユーザ辞書の登録方法などの概略を説明します。

(画像をクリックすると、新しいウインドウが開いて大きな画像が表示されます)

【1】辞書の役割

 PC-Transerの辞書には、翻訳に使われるものとして「基本語辞書」、「専門語辞書」、「ユーザ辞書」、「学習辞書」があり、参照用として「英和/和英辞典が」付属しています。
 「基本辞書」には冠詞や前置詞などのごく基本的な単語から、かなり専門的な用語まで約63万語登録されていて、必ず使用するようになっています。また、基本的な語句には意味情報や文法情報などが付加されています。基本辞書には追加や削除ができません。
 「専門語辞書」は分野別に用意された辞書で、22分野の専門辞書が付属しています。この辞書にも追加や削除できませんが、どの辞書を使うか指定することができます。
 「ユーザ辞書」は、一つの辞書に10万語まで登録でき削除も自由です。また、専門辞書と同じように使用する辞書を指定できます。同時に使用できるのは専門辞書と合わせて10個までとなっています。ユーザ辞書をうまく使うことが翻訳ソフト活用のカギとなります。
 「学習辞書」とは、対訳エディタ上で訳語の変更をすると、次回の翻訳時には最優先でその訳語が出力される「学習」機能で使用される辞書です。ユーザ辞書のようにファイルをエクスポートして一覧表示することができませんが名前を付けて使い分けることができます。
 「英和/和英辞典」は、参照用の電子辞書で、英和辞書に6万語、和英辞書に10万語登録されていますが、「翻訳」業務には少し物足りません。ただ、これを補うためにロボワードが付属しています。研究社リーダーズ+ブラスV2(46万語)が収録されているので基本的な翻訳には十分役立ちます。

演習

【2】辞書の設定

 辞書の設定は「設定」画面から行います。「設定」ボタンをクリックし、「辞書」タブをクリックすると設定画面が開きます。ここでは新規辞書の作成、追加、削除のほかに、ユーザ辞書が複数ある場合にどれを書き込み辞書にするか指定したり、辞書ごとに訳語の表示色を設定したりできます。さらに辞書検索の優先順位を決めることもできます。
 どの辞書をどの順序で使用するかは、翻訳する文書に依ります。組み合わせや順序を変えて調整してみましょう。

演習

【3】ユーザ辞書の登録(簡易登録、詳細登録)

 ユーザ辞書の登録画面を開くにはいくつかの方法があります。
@「単語」メニューの「辞書登録」をクリック、
Aツールバーの「登録」アイコンをクリック、
B対訳エディタで訳語対応してから訳語リストを開き((辞書登録))をクリック、
C「辞書参照」をして「登録」ボタンをクリック。
 デフォルトでは簡易登録画面が開きます。見出し語と訳語を入力して品詞を指定します。品詞に応じて見出し語の活用形が自動的に入力されます。最低限これだけで登録できます。
 一つの見出しに一つの訳語しかないというような場合、あるいは訳語を一つに統一する場合には簡易登録で十分です。
 「詳細登録」ボタンをクリックして画面を切り替えると意味情報やパターン情報を付加することができます。例えば名詞の場合であれば、人間、乗り物、建造物などのリストから意味の一番近いものを選んで「意味」情報を付加します。また、「名詞+前置詞句」といったパターン情報も付加できます。動詞になるとパターンの選択肢が多くなります。「動詞+目的語」のような目的語(名詞)を含むパターンの場合、名詞の意味情報も付加できるので、目的語の「意味」によって動詞を訳し分けることができます。

演習

【4】ユーザ辞書一括登録(辞書ソースの作成)

 ユーザ辞書は、登録画面を開いて1件ずつ登録することもできますが、翻訳実務では既存の対訳用語集を利用することが多いので、辞書一括登録の操作は必ずできるようにしておかなくてはなりません。
 一括登録するには、先ずソースファイルを作成する必要があります。ソースファイルの最も簡単な形式は見出し語と訳語をカンマで区切るか、タブで区切って並べたものです。
 この形式は簡単に登録できるというメリットがありますが、見出し語の品詞が全て「名詞」になってしまいます。リストの中に動詞や形容詞などを登録しても訳文に反映されません。
 そこで、手作業になりますが、品詞コードを埋め込んでから一括登録することになります。
 ユーザ辞書は一括でソースファイルに書き出せます。書き出したソースファイルをテキスト・エディタなどで修正して再度一括登録したり、Excelなどで一覧表示したり、Personal Dictionaryのような辞書検索ソフトで利用することもできます。

演習

【5】辞書登録のヒント

  • 辞書は出来るだけ小さく作り、使用するときに「調合」します。
  • 数字や記号、商品名など「未知語リスト」に書き出される語句に関しては、一見それ程重要に思えないかもしれませんが、ユーザ辞書に登録しておくと「未知語」のままよりも構文解析がうまく行くことがあります。
  • 一括登録はできるだけ名詞にとどめて置き、動詞や形容詞などは1件ずつ詳細登録した方が良いでしょう。
  • 出来るだけフレーズ単位で、意味のかたまりごとに適切な品詞で登録すると訳文自体が見違えるように良くなります。

演習

【6】標準辞書フォーマットUPF(Universal Platform)

 翻訳ソフトのユーザ辞書は、それぞれ固有のフォーマットになっていて互換性がありませんが、アジア太平洋機械翻訳協会が中心となって策定された標準フォーマットに変換する機能を使えばユーザ辞書の交換ができます。この機能は、主な翻訳ソフトにはほとんど装備されています。
 ユーザ辞書を標準フォーマットに変換するには、「スタート」メニュー→「すべてのプログラム」→「Cross Language」→「PC-Transer V10」→「ツール」→「UPコンバータEJ」と辿ります。

演習

月刊『eとらんす』 2003年12月号連動  Copyright© 2003 Babel K.K. All Rights Reserved.


MT研究会 オンライン講座 掲示板 研究レポート・試用レポート リンク集 メール