PC-Transer活用法 |
前処理フィルタと後処理フィルタ |
03 |
前処理フィルターの指定それでは試しに、前処理フィルターを指定して見ます。 契約書の中には以下のように、1センテンスの中に番号のついた箇条書きの項目が埋め込まれたものが頻繁に見受けられます。 The balance due under Article 4 above shall be adjusted for the following items: (1) wages due or to become due the Seller's employees, (2) payroll taxes, (3) pre-paid insurance, (4) pre-paid rent or rent due, (5) security deposits, (6) loss or damage to Business assets subject to Article 11. below, entitled "Damage or Destruction of Business Assets", (7) depletion of inventory, (8) any other items which require adjustment on the date of closing. これをそのまま対訳エディタに読み込むと、番号のついている部分が1つのセルに読み込まれてしまいます(図4)。これでは正しい訳文が出力されません。 -図4-
番号の前後で文を分割してから訳せば精度は格段に向上します。PC-Transerでは、事前に原文に制御コードを入力しておくことができます。文の強制分割は分割したい部分に「\|」を挿入します。そこで、prefilter.txtファイルに次のように記述して見ました。 s/\(1\)/\\|\(1\)\\|/g 正規表現では、()はメタキャラクターと呼ばれ、語のグループ化を表す記号として使われます。通常の記号として扱うためには \ を付けなければなりません。また、\ もメタキャラクターですので、\ 自体を表すには \\ と入力します。 さて、スクリプトを利用して前処理フィルターをかけると、うまく分割されて読み込まれました(図5)。 -図5-
テキスト処理で「検索・置換」は最も大切な機能です。翻訳ソフトに「正規表現」の使える強力な検索置・換機能が搭載され、別のソフトウエアを組み合わせて使わなくても、かなり高度な前処理や後処理ができるようになりました。あとはユーザのアイデア次第と言えるでしょう。 |
![]() |
|
Copyright©2002 S.Komuro Babel K.K. All Rights Reserved |
![]() |