大規模英文データ収集・管理術

第8回 「トミイ方式」とは (3)

筆者:
2011年9月26日

(3) データベースのツールとしての「トミイ方式」

前回(第7回)、英文データの収集方法として、大きく分けて次の3つがあることを説明しました。

1) 辞書添記方法
2) カード使用方法
3) パソコン活用方法

データベース(以下、DBと略称します)のツールとして使用できるデータは、まだここでは取り上げていませんが、「3) パソコン活用方法」で収集したデータだけです。

昨今では、英文データとして入ってくる情報はほとんどが電子化されたものですので、コンピュータに取り込むのは、比較的容易です。しかし、電子化されているデータだからといって、そのままDBのツールとして活用できるわけではありません。大分類、中分類、小分類など、できる限り細かく分類されてコンピュータの中に収納されていなければなりません。「分類」について取り上げるのは、この連載の第16回あたりになりますので、ここでは、「データベースのツールとしての分類」という切り口で述べて行きます。

データや情報が、すべて「カード」に記載ないしはコピーされていて、そのカードが分類されてカードケースに収納されている場合は、前回(第7回)、「影響」を例にとって説明しましたように、分類作業は、極めて楽です。しかし、コンピュータの中に収納されている場合には、全データの分類が先に終わっていて、ちょうど化学記号表のようにデータの「分類表」が作られている場合には、毎日毎日集まって来るデータを、その決められた場所――これを、これからは「お座敷」と呼ぶことにします――に流し込んでいけばよいわけですが、肝心のデータが十分な数だけ収集できていないうちに、先に「分類表」を作成するということは不可能であり、やはり、大量のデータを収集して初めて「分類」が可能になるわけです。

例えば、このような場合を想像してみてください。

大分類が「表現別」、中分類が「影響」までは分類してあって、その「影響」の中に、「影響」という英単語が内包されている文章が100点、言葉は汚いですが、味噌もくそも一緒に入っていたとします。そして今、その100の文章に「全員集合」(検索)をかけたとします。そうすると、100の文章が、PCの画面上に後から後からランダムに出てきて表示されるわけです。そのような状態で、一体どのように分類作業ができるでしょうか? 後から後から出てくる文章を瞬間的に記憶し、前方にあった類似した文章のそばに移動させたり、後ろへ移動させたり、気の遠くなるような分類作業を繰り返していかなければなりません。

それでも、今、例に取り上げた、大分類が「表現別」、中分類が「影響」の分類くらいならば、まだ、やってできないことはありません。ところが、大分類が「アルファベット順」、中分類が provide のような厄介な英単語だとしたらどうでしょうか? 翻訳を手がけるほとんどすべての人がご存じのように、この provide にはいろいろな「意味」や「用法」があり、したがって、その「訳語」となると、極端な言い方をすると、“文章の数ほど「訳語」がある”と言っても決して過言ではないほど始末の悪い言葉です。

provide という単語はそのような言葉ですので、私は、若干誇張して言うと、出くわすたびに集めています。そのため、provideという言葉を使っている文章の数は1,300以上あります。このような言葉を、PCの画面上で、記憶に頼っての分類など、不可能に近いことです。

しかし、その作業を容易にするための良い方法が2つあります。

そのうちの1つは、上に述べた「影響」を例にとって述べると、その100の文章をプリントアウトし、具象化することです。そして、その100の文章を1つずつカットして短冊状にし、それを分類していくわけです。ということは、なんてことはありません。分類の手法そのものは、「 2) カード使用方法」と何ら変わるものではありません。しかし、それでは、「 3) パソコン活用方法」ではなく「 2) カード使用方法」になってしまいますので、なんとか、歯を食いしばってでも「 3) パソコン活用方法」にしがみつかなければなりません。

そこで、もう1つの方法です。これは、邪道といえば邪道かもしれませんが、私がすでに作っている「トミイ式分類表」を使うことです。時間と労力を節約するのは、決して悪いことではありません。来年の1月ごろから掲載する“6「分類」の構成”という節で取り上げます。それまでお待ちいただく間は、読者の皆さんは、皆さんなりの方法でデータを収集し、分類・収納する方法を確立していただきたいと思います。

最後に、DBをどのようにして構築するかについては後に譲るとして、仮に出来上がったDBはどのように活用されるかについて、簡単に述べておきます。

この連載の第1回に、「トミイ方式」の大きな機能のうちの1つに

どのようなものを収集し、それをどのように分類・収納しておくと、どのような目的に使うことができる

ということがあることを述べました。収集・分類したDBの用途はたくさんあります。詳細は、今年の12月ごろ、“5「トミイ方式」の機能と目的”で説明しますが、ここに簡単に述べますと、次のことが考えられます。

  1. 手作りの辞書が作成、英文作成や和文英訳の際の強力な補助ツール作成
  2. 収集・分類の結果としてできたDBで技術英語・技術翻訳の独習
  3. 機関紙や雑誌への投稿、講演活動、翻訳関連国際会議でのプレゼンテーション活動
  4. 著作活動や語学教育における指導

やや手前味噌になるかもしれませんが、これらは、すべて筆者が実際にDBを活用してきた例ばかりです。ただ、これらは、すべて、十分な「質」と「量」に裏打ちされたDBでなければなりません、換言すると、かなり長期間にわたって収集活動を続けなければなりません。そうすると、お歳を召されている方には不向きかもしれません。しかし、若干、不謹慎であるかもしれませんが、現実に私の周辺にはそのような方々が多くいらっしゃいますので、あえて、もう一つ挙げさせていただくと

  1. 老化防止対策と道楽のすすめ

があります。

次回は“3「トミイ方式」のきっかけ”です。

筆者プロフィール

富井 篤 ( とみい・あつし)

技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。