■第9回 翻訳メモリを日英翻訳で活用する方法
第9回 翻訳メモリを日英翻訳で活用する方法
日本人が英文を書く際に、英語らしい構文や語句を選択することはなかなか難しいものです。どうしても、日本語に引きずられた英文になってしまいます。
そのために、日英翻訳作業では、日本人が下訳した英文をネイティブがチェックして完成させるという方法が一般的になっています。
最近では、Web検索エンジンを使って、Web上のテキストをコーパスとして利用し、表現のチェックをすることが流行しています。皆さんも、出現回数を単純に比較して、回数の多い表現を選択する、というような使い方をしたことがあるのではないかと思います。
しかし、このような雑多なWEB上のテキストよりも、自分が得意とする専門ジャンルの、正しく自然な英文を翻訳メモリに大量に蓄積しておいて検索したほうが、表現辞書としての有効性が高まります。
PC-Transerの翻訳メモリは、英日と日英のどちらで登録しても、そのまま双方向で利用できます。この特長を活用しましょう。
日英で利用する翻訳メモリを作るには、Webや印刷物(OCRで電子化)などから英文を収集して、機械翻訳し、英日方向のまま翻訳メモリに一括登録します。
それをそのまま日本語から検索します。
日本語の訳文は単に検索のためのキーワードとして利用できさえすれば良いので、訳文全体の完成度は問いません。直訳で十分です。訳文作成に時間をかけていては、大量に処理できません。大量になければ「参照用」として役に立ちません。
機械翻訳する際に専門語辞書を適切に設定しておけば、訳文全体として見れば不適切でも訳語そのものは十分に使えます。PC-Transerには、専門語辞書を自動的に選択してくれる機能がありますので設定も簡単にできます。
要するに、「英文を検索するために機械翻訳を使って日本語のインデックスを付ける」と考えてください。
実際に日英翻訳で使用する場合は、翻訳メモリペインで「キーワード検索」を行います。これにより、日本語キーワードの英訳とその使い方が確認できます。
これを英文チェックに生かします。「Web検索」機能を併せて使えば、さらに柔軟なチェックができるでしょう。
PC-Transerを日英翻訳に活用したい人は、とにかく英日方向で翻訳資源の蓄積を行っておくことが大切です。これは、英語学習と通じるところがあります。
たくさん英文を読んだり聞いたりしてインプットしておかなければ、英文を書いたり話したりすることができないのと同じです。PC-Transerなら文句も言わずにどんどん学習してくれます。
<翻訳設定のヒント>
インデックスとして利用するために訳文出力する場合は、専門語辞書やユーザー辞書を適用し、単語やフレーズがそれなりに正しく訳出されるように設定することが重要です。
翻訳設定は以下のように指定すると良いでしょう。
- できるだけ日本語に訳出されるように、「大文字を小文字にして訳す」にチェックを入れる。
- 長い文章がある場合は、訳出に時間がかかる上に正しく訳せないことが多いので、「長い文章を節・句ごとに区切って訳す」にチェックを入れる。
- 辞書としての利用にふさわしい訳語にするために、「命令文を平叙文として訳す」にチェックを入れる。
- 「固有名詞を英語のまま表示する」ほうが不適切に訳されるよりも無難なのでチェックを入れる。
- 「合成語を分割して訳す」かどうかは、出力結果を見て判断する。
このような参照用としての翻訳メモリは、文書の種類やジャンルをできるだけ絞り込んで作成することをお勧めします。
翻訳メモリは、同時に10個まで使用できます。絞り込んで作成した翻訳メモリを、翻訳する文書に合わせて適切に選択すれば、効率の良い検索ができます。
<チェック作業の例>
抽象的な話だけでは退屈なので例を挙げましょう。
以下の日本文を英文に翻訳することにします。
【原文】しかし,これらの資源を手作業で構築することは高価である.
スタイルは「標準」、専門語辞書自動選択により「電気電子」「コンピュータ」
専門語辞書を設定して、訳文を出力します。
【訳文】However, it is expensive to build these resources by manual operation.
専門語辞書は次の2件がマッチしました。
資源=resources 手作業=manual operation
これらの訳語はとりあえず信頼できると考えて、その他の語句を翻訳メモリで調べてみます。
「構築する」をキーワード検索します。
筆者が作成した「参照用ユーザー翻訳メモリ」(マッチ率8%)で以下の検索結果が表示されました。([]は筆者が付加)
英語の大きな注釈がついているコーパスを[構築する]こと:[Building] a Large
Annotated Corpus of English:
日本語の文章は不自然ですが、「構築する=build」が参考になります。
「高価」も調べてみましょう。
「参照用ユーザー翻訳メモリ」(マッチ率2%)で以下の検索結果が表示されました。
しかしながら、異なる領域にカスタマイズするのが困難であることに加えて、個々のス コーリングは、極めて[高価]およびエラーに従属する全機械翻訳システムを通る遅い、 手コード化流路をすることによって実行された。 However, the individual scoring was performed by doing a slow, hand-coded pass through an entire machine translation system which is extremely [expensive] and subject to errors, in addition to being difficult to customize to different domains.
日本語文はすさまじいものがありますが、「高価=expensive」は確認できました。
さて、「手作業」は専門語辞書で「manual operation」となっていますが、前置詞を確認したいので翻訳メモリを検索してみます。
残念ながら「参照用ユーザー翻訳メモリ」にはヒットしませんでしたが、翻訳スタジオに付属している「科学技術翻訳メモリ」を検索したら9件ほど見つかりました。
このように、初期画像位置合わせのための各パラメータは、[手作業で]決定され、次 に、「理想的」減算画像が得られる。 Thus, each parameter for the initial image matching is determined [manually] and "ideal" subtraction images can then be obtained.
これを見ると、「手作業で=manually」となっています。これなら前置詞が不要ですっきり表現できそうです。さらに「Web検索」機能を使って調べても良いでしょう。
こんな調子でチェック作業を進めることができます。
今回説明したことを実行するには、Web等から必要な原文を収集したりOCRで印刷物を電子化したりするスキル、その原文ファイルを適切な形式に整形するスキル、PC-Transerでの「翻訳設定」、「専門語辞書自動選択」機能の実行、翻訳メモリの一括登録、翻訳メモリの設定、翻訳メモリペインでの検索、「Web検索」機能の実行などのスキルが必要です。
これらの操作をスムーズにできるようにするには適切なトレーニングが必要ですが、少しずつ練習すれば誰でも役に立つテクニックを身に付けることができます。
記事の内容は筆者自身のノウハウに基づいております。記事の内容によって万一損害を被ることがあっても一切責任を負いません。また、この記事の内容に関して発売元の株式会社クロスランゲージへの問い合わせはご遠慮ください。(小室誠一)
最終更新時間:2009年04月08日 18時38分09秒