著者ごとのアーカイブ

大規模英文データ収集・管理術 第50回(最終回)

2013年 5月 13日 月曜日 筆者: 富井 篤

10 連載を終って

一昨年6月から、隔週の月曜日に公開してきたこの連載も、今回が最後になりました。いかがだったでしょうか。最初から最後までお読みくださった方、最初は読んでいただいていたが途中で愛想をつかしてしまわれた方、最初は読まなかったが途中から読み始めてくださった方、いろいろな方がいらっしゃると思いますが、共鳴できるところがありましたでしょうか。あるいは、できるところから実践し始めたという方、いらっしゃるでしょうか。

筆者にとっては、この50回の連載は、「トミイ方式」の長所や短所を知るうえで、とても参考になりました。また、書いているうちで、足りない所、紙幅が許す以上、もう少しポイントを絞って書き足していかなければならなかった所なども良くわかりました。いずれ、何かの機会がありましたら、この望みは果たしたいと思っています。その時は、切り口を変え、技術英語に携わっている方たちのみならず、英語を必要とする社会全般の人たちにも目を向けた書籍を作っていきたいと思っています。と同時に、もしこれから始めたいと思われる方がいらっしゃったら、できる限りの支援をしたいとも思っています。

人にはよく、「あのような大辞典を、よく何冊も作れましたね」といわれることがあります。しかし、辞書など、データさえあれば、copy & pasteで誰にでも、いとも簡単にできるのです。収集した英文データを切って貼り、その間にちょっと文章を書き足していきさえすれば誰にでもできるのです。それよりも、もし褒めてくれるのであるならば、辞書や書籍を作ったことよりも、36万点という英文データを集めたことについて褒めていただきたいと思っています。40年近くかけて収集してきた、あのデータの量を褒めていただきたい、というよりも、そのことについて驚嘆していただきたいと思っています。

また、「あの分類が素晴らしい」といってくれる方も多くいます。しかし、同じ系統で、同じ範疇の英文カードが大量に集まっていて、それを整理整頓しようと思えば、誰がやっても同じような分類ができるわけで、50枚や100枚のカードを分類しようと思ったって分類ができるというものではありませんが、同じ系統の英文カードをたくさん集めれば、確度の高い分類ができるわけです。昔、政治の世界でよく「数は力なり」と言われたころがありましたが、この「トミイ方式」も、まさに「数は力なり」です。

英文データを数多く集めればよい分類ができるということは今述べたとおりですが、その数が、その気になってやりさえすれば、信じられないくらい短い期間のうちに、大量に集めることができ、そのデータを基に、信じられないくらいの、奇跡としか思えない短時間に、奇跡としか思えない異様な本を書くことができるものなのです。

この連載の第5回で、拙著、三省堂の『技術英語前置詞活用辞典』の前身である『前置詞の研究』という本を書いた時のエピソードを紹介しました。それは、脱サラをし、この技術翻訳の世界に入ってからわずか3年少々で『前置詞の研究』という本を書き始めたというものですが、この連載の最後に当たり、ともすると、自分の自慢話になってしまうかもしれませんが、特別にお許しを頂き、「トミイ方式」の隠れた「賢さ」を知っていただくため、類似のエピソードをいくつか紹介させていただきたいと思います。

私が初めて、仲間の協力もいただき『科学技術和英大辞典』という2,000ページほどの辞書を出版したのが1988年1月――実際には1987年の暮――です。一方、構想を練ってから出版社との合意に達するまでに1年、執筆だけで5年間、脱稿後出版までに2年、合計8年を差し引くと、1979年には実質作業をスタートしていたことになります。実は1979年というのは、私が脱サラしたのが1974年で、これとほぼ同時に「トミイ方式」を立ち上げたわけですから、実質的には「トミイ方式」をスタートさせてから、わずか5年で「和英大辞典」の構想を練り始めたということになります。「和英大辞典」を作りたい一心で英文データを収集し続けたというのであれば、5年かければそのくらいのデータが集まっても不思議ではありませんが、今までにこの連載で述べてきたように、「7つの大分類」のすべての英文データを集めてきた中で、わずか5年で「和英大辞典」を作ろうと思わせるだけのデータが集まっていたということは、若干、自画自賛的になりますが、奇跡に近いことだと思えてなりません。

ほかに、最終的には丸善から出版された「技術翻訳のテクニック」の出版までの顛末、それに、これも奇跡的なことだと自負していますが、わずか45日間で書き上げてしまった三省堂の「技術英語構文辞典」の真相などなど、「トミイ方式」を実践してきたがゆえに可能ならしめたお話もたくさんあるのですが、これらはこの程度にとどめ、結論として、「英文データさえたくさん集めれば、やりたいことは何でもできる」ということを強調させていただきたいと思います。

また、「トミイ方式」を敷衍していくと、このような機能は、英文データだけに限らず、英文データ以外の一般データや情報の収集・データ化に応用することができます。

例えば、擬音語や擬態語の収集です。昔、何かの本で「擬音語や擬態語を多く使用しているのは平家物語である」ということを読んだことがありますが、早速、四巻からなる平家物語を買ってきて、娘と手分けして集め、まだ、コンピュータがそれほど身近にはなかった頃のことですので、カードに書き込んだことがあります。その後、最初の部分から徐々にコンピュータに入れ始めていますが、カードのままでも、昔、流行ったパンチカード式の概念を導入すれば、カード上のデータのままでも、なんら差支えないこともわかっています。

もっと身近な例としては、筆者が最も崇敬している古今亭志ん生の古典落語や朝日新聞の「天声人語」なども、それぞれ特有の分類方式を取り入れ、カードに収録しています。そのうちのあるものは、必要であり、かつ可能であり、意義のあるものから徐々にコンピュータ化しています。

最後に、現在採用しているコンピュータ方式について、これから再検討しなければならない点を一つ告白し、読者の皆さんからのお知恵を拝借したいと思っています。

筆者は、元来、ITやコンピュータにあまり強くないので、現在はExcelを使用しています。この方式だと、1つの英例文から複数個の英文データを採取する場合、その英文データの数だけ同じ文がデータの中に収録されることになります。まして、複数の英例文から成り立つパラグラフ単位で英文データを採取したとすると、その英文データの数だけ同じパラグラフがデータの中に収録されることになります。

できれば、元のパラグラフを1つだけ収納し、そこに収集したい英文データに適宜タグやフラッグをつけ、いろいろな英文データを1つの英文、さらには1つのパラグラフから検索できるようにしたいと考えています。コンピュータの容量からデータベースの中に1つの英文というわけにはいきませんが、収納しなければならない英文データの数は、ぐっと少なくすることができると思います。

まだ未知数をたくさん抱えた上での最終回ですが、お読みくださった皆様、ありがとうございました。この連載は、「トミイ方式」の紹介を主題とし、技術英語の解説を副題としましたが、この次に皆さんにお目にかかれるときは、この最終回の項の冒頭にも述べましたが、これまでと切り口を変え、この両者を均等に、あるいは、後者のほうに重きを置いた内容の書籍にしたいと思っています。近い将来、再びお目にかかれることを楽しみに「筆をおきたい」と思います。

最後になりましたが、この連載に関し、いろいろご指導くださいました三省堂のご担当者の方々に心よりお礼を申し上げます。

ありがとうございました。また逢う日まで!!

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第49回

2013年 4月 29日 月曜日 筆者: 富井 篤

9 これからの「トミイ方式」・3

(2)コンピュータ方式の強さ

前回に続き、今回は、事例IIとして

収集 ⇒ 分類 ⇒ 収納

の全工程を学習するため、「富井翻訳教室」で取り上げた1月の「エスカレーター」を取り上げることにしました。

まず、元の英例文を表示します。これは、エスカレーターの記述の、2つのセンテンスからなる書き出しのパラグラフです。

An escalator is a continuously acting passenger conveying device which has about ten times the hourly handling capacity of a lift. The escalator conveys passengers at a speed of 8 - 12 ft/sec.

この英文から、自分にとって欲しい英文データを拾い出し、分類した上で、分類表の中の適切な場所に収納するわけです。2つの文から成り立っていますが、最初から通し番号を付けて解説していきます。

(1) An escalator is a continuously acting passenger conveying device のAn と a はともに「総称」の不定冠詞として、 「D 品詞別」の中の 23、および「E 構文別」 の中の 17 1 に入れます。(2) which は大分類が「D 品詞別」の中の 321 に入れます。この場合の関係代名詞は、which ではなく that を使うべきところですが、なぜか、この場合は which が使われています。これは、不適切な用法と考えたほうがよいでしょう。(3) which has about ten times the hourly handling capacity of a lift. これは、「倍率構文」として大分類が「E 構文別」 の中の 51 に入れます。 (4) ten times は「数詞」の書き方として、大分類が「F 数量表現別」の中の 2115 に入れます。「分類表」には「5 10未満の整数」と書いてありますが、「10以下」とする説もありますので、この場合はこれに該当します。 (5) liftを「A アルファベット順」に入れます。 (6) また、 「B 50音順」の中に「エレベーター」として入れます。lift という言葉はイギリスなどでは「エレベーター」 という意味ですが、アメリカでは「エレベーター」 は elevator です。(6) convey を「A アルファベット順」に入れます。 (7) at a speed of 8 - 12 ft/sec を大分類が「F 数量表現別」の中の 82211 に入れます。この表現は、範囲を持った数量語句ですので、正確には、 at speeds between 8 - 12 ft/sec とか、もっと厳密には、at speeds ranging from 8 to 12 ft/sec などと書いたほうが良いかもしれません。そうすると、分類番号は 82225 となります。(8) また、同じく 「F 数量表現別」の中の 10 60 にも入れます。

わずか2つのセンテンスの中から、8個のデータを採取している場合の例です。

次は、ちょっと長いですが、2つ目のパラグラフ全文で、5つのセンテンスから成り立っている英例文です。

Each individual step of an escalator is constructed as a carriage provided with four small wheels (Figs. 1 and 3). The top and the bottom pair of wheels each run on rails; the rails of the top pair are set farther outwards than those of the bottom pair. On the upward journey of the step the two rails are situated in the same plane, but a short distance before the top reversal point and a short distance past the bottom reversal point the rails are so displaced in relation to one another that the inner rail is below the outer rail. As a result of this arrangement the steps gradually merge into a flat horizontal surface at the top of the escalator, enabling the passengers to step off easily. Similarly, convenient stepping-on is ensured at the bottom of the upward-moving escalator.

順に説明していきます。

(1) Each,construct,as,provided with などは「A アルファベット順」にとります。(2) The top and the bottom pair of wheels は「D 品詞別」の中の 21 にとります。「分類表」には「1 冠詞全般」としか書いてありませんが、実は、大変大事な冠詞の用法で、bottom の前の the がないと pair は複数形になります。「冠詞がなければ後続の名詞は複数、冠詞があれば単数」、すなわち「冠・単」です。 「冠・単」と覚えれば「簡単」に覚えられます。(3) each run on rails; この場合のセミコロンを大分類が「F その他」の中の 24 にとります。セミコロンには、「しかし」「したがって」「例えば」「すなわち」などなどたくさんの意味がありますが、ここは「補足説明」とか「詳細説明」ととらえるとよいでしょう。たくさん集まったら、このように細分化すると勉強になります。(4) are set farther outwards than those of the bottom pair これは、比較の表現です。大分類が「E 構文別」 の中の 42 に入れます。 (5) the two rails are situated in the same plane, これは「位置する」というもので、大分類が「C 表現別」の中の 32 に入れます。今は「2 位置する(動詞形)」としか書いてありませんが、やがて、located,placed,positioned などたくさん集まるはずですので、その時点で細分化します。(6) a short distance past the bottom reversal point における前置詞 past を「D 品詞別」の中の 11past1 に入れます。past は、five past ten(10時5分過ぎ)など、時間を表す言葉としてあまりにもお馴染みすぎ、前置詞として実感がわかない言葉ですが、before に対する言葉として覚えておくと便利な言葉です。(7) the rails are so displaced in relation to one another that the inner rail is below the outer rail, この文は so that として「A アルファベット順」の中の so の場所に入れます。so that の中にはいろいろありますが、これは so + 過去分詞 + that に入るものです。ただここでは、単に過去分詞だけではなく、 displaced という過去分詞と that の間にin relation to one another という語句が挿入されているという、きわめて珍しい例です。 ぜひ、収集しておいてください。 (8) in relation to は「~に比べて」とか「~に比較して」というもので、大分類が「C 表現別」の中の 57 2 に入れます。 (9) As a result of this arrangement これは「結果」の表現として、大分類が「C 表現別」の中の 14 4 に入れます。前の文章が「原因」になっているわけですから、ちょっと長いですが、前の分と一緒にとりましょう。(10) また、大分類が「E 構文別」 の中の 3214 にも入れます。 (11) gradually、merge into などは「A アルファベット順」にとります。 (12) a flat horizontal surface at the top of the escalator, enabling the passengers to step off easily. この場合の, enabling は「因果構文」です。前の文章が主語で、それを This で受けると、This enables the passengers to step off easily. となります。大分類が「E 構文別」の中の 324 に入れます。 (13) Similarly, は「同様に」ですから、大分類が「C 表現別」 の中の 45 5 に入れます。 (14) ensure は「A アルファベット順」にとります。

まだこの後も続くのですが、ここまでにしておきます。

このようにして、6月から翌年の3月まで、この調子で収集していくと、若干の初期データも含みますが、次のとおり、1,058個のデータが集まります。

アルファベット順: 435
50音順: 123
表現別: 136
品詞別: 148
構文別: 112
数量表現別: 55
その他: 49

これらのデータは、もちろん筆者の感性や関心や必要性などに基づいて採取したものであり、収集対象は人それぞれ違うと思いますが、標準的翻訳者、標準的翻訳指導者として採取したつもりでいますので、かなり標準的な英文データが収集できたと思っています。

受講生には、最初に配布した、まだ英文データの入っていない分類表の中に上記の英文データを入れ、新しい分類表を作成して、講座修了のお祝いとしてプレゼントしています。

これで「トミイ方式」の連載は、次回の「連載を終わって」を残しすべて終わりました。

次回は、「トミイ方式」の通信制講座についても触れたいと思っています。どうぞ、次回の「連載を終わって」を楽しみにしていてください。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第48回

2013年 4月 15日 月曜日 筆者: 富井 篤

9 これからの「トミイ方式」・2

前回は「カード方式の優しさ」について述べました。今回は「コンピュータ方式の強さ」です。

(2)コンピュータ方式の強さ

このコンピュータ時代に、この種のデータ管理にコンピュータを使わない手はありません。いくら、時と場合によっては「カード方式」のほうが手っ取り早くて便利であろうと、それはあくまでもやむを得ない場合の便法であって、やはり究極的にはコンピュータです。堅牢な石垣の石はやはりコンピュータで、カードは石と石の間を埋める小石にすぎません。

そこで、ここでは、今回と次回の2回にわたって、コンピュータを使った実践的英文データの収集・管理方法を実例に基づいて述べていくことにします。「カード方式」の場合には、コピーや転記などをしないといけませんので、特別のOA機器とか、高度のテクニックを使わない限り、どうしても、1つの文章から採取する英文データの数は遠慮がちになってしまいますが、「コンピュータ方式」の場合には、その容量は無限にあるといってもいいほど大きいので、欲しいデータは遠慮なく、いくらでも採取することができます。なんといっても、これが「コンピュータ方式」の絶対的な強さです。そのあたりを、筆者の主宰する「富井翻訳教室」で2007年に取り上げた、「トミイ式英文データ収集・分類・収納方式」と題するゼミを追体験してみることにします。

1年間といっても、8月は夏休み、9月は富井翻訳教室の翻訳フォーラムのためお休みですので、実質10か月ということになります。これを

  1. 第1期:4月と5月の2か月
  2. 第2期:6月から12月までの、8月と9月を除いた5か月
  3. 第3期:翌年の1月3月までの3か月

の3期に分け、第1期では、今までこの連載で述べてきた「英文データ収集のきっかけ」から始まり、変遷や、分類、機能などを学習しました。

第2期では、データはすでに大量に集まったものと仮定し、その集まったデータをいかに分類・収納するかについて実地に学習しました。すなわち、

収集 ⇒ 分類 ⇒ 収納

の工程から成り立つ「トミイ方式」のうち、「収集」工程を飛ばし、

収集 ⇒ 分類 ⇒ 収納

という工程の学習をしました。そして、各月ごとのテーマを下記のように決め、それらの単語を使っている英例文をそれぞれ約50個ずつ俎上に載せ、その中から欲しい英文データを集めて「分類」・「収納」の学習をしました。

  1. 6月:cause
  2. 7月:apply
  3. 10月:available
  4. 11月:allow
  5. 12月:as

第3期では、英語の文献を取り上げ、その中で、何を収集するかから始まり、さらにその集めた例文をどのように分類し、どこに収納するかについて学習しました。各月のテーマは、各受講生の専門分野に関係なく、平均的な受講生すべてにとって違和感なく取り入れやすいものとして

  1. 1月:エスカレーター
  2. 2月:特許文
  3. 3月:ヘリコプター

を選択しました。すなわち

収集 ⇒ 分類 ⇒ 収納

の工程を学習しました。

受講生には、事前にExcelで作成したかなり詳細な分類表をCDの形で渡し、毎回、その分類表の中に入れていく学習法を取りました。

事例Iの今回は、第2期の12月に取り上げた as について、その時の教材に基づいて「分類」と「収納」に挑戦してみようと思います。スペースが許す限り、as の様々な用法についても言及しながら説明を加えていきます。

文章の頭についている番号は、このテキストの中で使われている文章番号です。そのすぐ下に書いてあるのが、解説です。解説は、黒字で書いてある「解説文」と、①,②,③,……で表されている採取すべき英文データから成り立っています。①,②,③,……の中で、赤で書かれているものは重要であり、必ず採取すべき英文データを、そして青で書かれているものは必ずしも重要ではなく、興味があったり、時間的余力があったりするときに集めればよい英文データを、それぞれ示しています。①,②,③,……の中には、英文データの名前、分類番号、分類表の中の収納場所、採取する理由や目的、などが書かれています。

分類表なくして理解することはむずかしいと思いますが、このような分類表があって、分類番号に従ってそのセルの中に入れていくのだというイメージをもってお読みください。

最初は、テキストの中の3番目の英例文です。

3 Transmitted torque can be as high as 100 million lb-in. and . . .

3 は as _____ as として数量表現で使われている as です。 ① 「トルク」の表現として、大分類が「F 数量表現別」、中分類が「10 物理量」 、その中の「48 トルク」の中に入れます。② be as high as 100 million lb-in. の部分は、同じく大分類が「F 数量表現別」、中分類が「8 基本パターン」 の中に、分類番号 832 として入れます。③ また、大分類が「F 数量表現別」、中分類が「9 数量語句周りの表現」 の中の、分類番号 921,すなわち「1 最大(高)」 にも入れます。このように、as _____ as が「感情を表している表現」なのか、「最大・最小」を表している表現なのかは、前後関係を見ないとわからないことが多いです。④ can を大分類が「D 品詞別」、中分類が「5 助動詞」、小分類が「1 個々の助動詞」、その中にすでに11月に設定されている「5 must」の後ろに「6 can」を設定し、そこに入れます。もちろん、やがて、助動詞が出そろった時点では、並べ替えをしなければなりません。

この例は、「数量表現別」に偏ってしまっていますが、「品詞別」も含め、1つの文から4つの英文データを採取したことになります。

次は、12番目の英例文です。

12 As has been observed, the invention lends itself to use in detecting undesired ferrous metal to prevent damage to machines.

12 は As の後ろに完了形が来ている例です。 ① observe,invention,lend,detect,prevent などを 「A アルファベット順」 にとります。② in detecting は大分類「D 品詞別」の中の 133 に入れます。③ undesired は「反意語」として「G その他」の中の「5 反意語」の中に入れます。「単語」欄に desired を、「接頭辞」欄に un を、「反意語」欄に undesired を、それぞれ書き込み、例文を挿入します。④ damage は必ず 「A アルファベット順」にとりましょう。damage of ではなく damage to であることが学習できます。wear もそうです。wear of ではなく wear to です。⑤ 屋上屋の感じがしますが、damage to の to を大分類が「D 品詞別」の中の 11to1 に入れます。

これは、1つの文から5個、厳密には、①を5個と数えると9個、採取したことになります。

ちょっと長くなりますが、もう1つだけ挙げてみます。

16 As is true of any interaction forum, you should feel free to express yourself completely in a real-time conference.

16 は As is true of … で、「~真実であるように」という意味の表現です。これも「B 50音順」に取っておくとよいでしょう。① anyinteraction forum などは「A アルファベット順」 にとりましょう。 ② should は、大分類「D 品詞別」の中の「5 助動詞」、その中の「1 個々の助動詞」の中に、新たに追加してください。③ feel free to express … は「自由に~する」とか「遠慮なく~する」というものです。「B 50音順」の中に「自由に」と「遠慮なく」の2か所にとりましょう。④ また、 「A アルファベット順」 の中の feel と free も2か所にとりましょう。⑤ real-time も「A アルファベット順」 の中にとります。⑥ さらに、「リアルタイム」として「B 50音順」の中にもとりましょう。

これは表向き6個になっていますが、厳密に数えると、9個になります。

次回は、第3期の1月のテーマである「エスカレーター」を取り上げます。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第47回

2013年 4月 1日 月曜日 筆者: 富井 篤

9 これからの「トミイ方式」

「トミイ方式」のあらましについては、前回の第46回までで、ほぼ終わりました。これからは、第47回から第49回までの3回にわたり、“これからの「トミイ方式」”として、「トミイ方式」をどのように実地に活用していくか、理想に走るのではなく、いかにして現実的に意味のある使い方をしていくか、について述べていきたいと思います。

「トミイ方式」はいろいろな時代を変遷し、現在の「コンピュータ・カード併用時代」に到達したわけですが、これは、第45回で述べたとおりです。そこで、ここからは、「カード方式のやさしさ」と「コンピュータ方式の強さ」の2つに分けて述べていきます。

(1) カード方式のやさしさ

「3大馬鹿」――ピラミッド、万里の長城、戦艦大和――に加えられ、「4大馬鹿」の一つに数えられかねない、このコンピュータ時代の「カード方式」は、一見時代遅れに見えますが、「馬鹿とはさみは使いよう」で、カードに英例文を書き込んだり、コピーしたりするこの方式は、欲しいと思う英例文が、「7つ道具」さえ携えていれば、いつでもどこでも誰にでも収集できる、われわれにとってとてもフレンドリーな英文データ収集方法です。分類方法がまだ確立されていない状態では、英例文を収集した後で、若干の戸惑いはありますが、1件1葉主義――1つの英例文を1枚のカードに書き留めておくこと――を守ってさえいれば、元の文献に赤で傍線を引いて安心してしまう「赤線方式」とは違い、姿形はどうであれ、欲しい英例文だけは間違いなく採取してあるという点で、確実に“指先が「トミイ方式」にかかった”ということになります。

収集した後で、集まったカードを (1)自分自身の方法で分類・収納するか、(2)すでに確立されている「トミイ式分類法」に従って分類・収納するか だけのことで、立派な「データベース」が出来上がります。

「7つ道具」とは、まだ「カード方式」全盛時代の話であり、今のコンピュータ時代では少々そぐわない部分もありますが、次の7つです。

(1) クリップ
2個。書いているうちに複数枚のカードとカーボン紙がずれないようにするためのもの

(2) カッター
英例文を切り取るためのもの
(3) ブランクのカード
切り取った英例文を貼り付けるためのもの
(4) 糊
切り取った英例文をカードに貼るためのもの
(5) 赤のボールペン
該当する語・句・節などをカードの上部に書き込んだり、該当する語・句・節などにアンダーラインを引いたりするためのもの
(6) 黒のボールペン
短い英例文の場合、カッターで切り取るのではなく、カードに直に書き込むためのもの
(7) カーボン紙
1つの英例文から数か所にある語・句・節などを採取する場合、カードの間にカーボン紙を挟んで複数枚の英例文を採取するためのもの。2枚のカーボン紙を使い、黒のボールペンで強く書くと、最高3枚までのカードを作ることができます

これら「7つ道具」を使うと、外出先ではもちろんのこと、自宅や事務所の机の上でも、極めて簡単に英例文をデータに採取することができます。一言で「カード方式」といっても、素朴で簡単なものから高度の複雑なものまでいろいろあります。ここでは、上記の「7つ道具」を使って誰にでもできる、それでいてそれなりの価値のある、最も一般的な事例を2つだけ紹介します。条件によっては、それ以外いろいろな場合が考えられますが、それらについては、いずれ何かの機会に紹介したいと思います。

事例I

背景:
自宅で英文の本を読んでいて、ある1つのセンテンスの中にどうしても欲しい英語の言葉とか表現が複数個、例えば、ここでは2個、あったとします。その2つのデータを収集したいが、本なのでカッターで切り取ることはできないという場合を考えてみます。(カッコ内の数字は、上記した「7つ道具」の番号を表します)

作業:

これで、2枚のデータカードが完成します。

事例II

背景:
英文原稿の該当ページを2枚コピーして作業を進める場合を考えてみます。その場合は、クリップ(1)や黒のボールペン(6)やカーボン紙(7)などは不要になり、代わってカッター(2)と糊(4)の出番となります。

作業:

これで、同じ英文が貼られたカードが2枚出来上がります。

このあとは前の事例と同じ作業になります。すなわち

これで、2枚のデータカードが完成します。

このようにして収集され、分類され、収納された英例文は、カードに収録されたままでも、立派な「コレクション」であり、「活用機能」、「学習機能」、「制作・発表機能」を発揮します。それを分類された形でコンピュータに入れれば、立派な「データベース」になります。

次回は、「コンピュータ方式の強さ」について述べます。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第46回

2013年 3月 18日 月曜日 筆者: 富井 篤

8 英文データの実践的収集方法(コンピュータ方式)・2

前回に続き、今回は「データカード4」から始めます。

データカード4

これは、不定冠詞および「その他」の中の「種族全体」の表現です。

まず、不定冠詞 a です。第42回をご参照ください。

①「シート見出し」の「品詞別」を開きます。
②「中分類」として「冠詞」を選びます。
③「小分類」として「不定冠詞」を選びます。
⑤「細分類」として「種族全体」を選びます。
⑤ 元の英文を「英例文」の「列」に入れます。

第42回では、この英例文を「大分類」として「その他」の中の「種族全体」にも入れるということについては言及しませんでしたが、「種族全体」を「無冠詞+複数名詞」で表現することもあるため、「その他」の中にも2つの表現方法をまとめて入れておこうという意味です。

データカード5

これは、「50音順」の中に収録しておきたい英例文です。

第42回をご参照ください。

①「シート見出し」の「50音順」を開きます。
②その中の「うむ」という場所に英文データを入れます。

大規模英文データ収集・管理術 第45回

2013年 3月 4日 月曜日 筆者: 富井 篤

8 英文データの実践的収集方法(コンピュータ方式)・1

第40回から前回の第44回まで、「英文データの実践的収集方法」の「カード方式」について説明してきました。今回(第45回)と次回(第46回)の2回にわたり、「英文データの実践的収集方法」の「コンピュータ方式」について解説していくことにします。

すでに過去のものとなった「カード方式」については5回にわたり説明し、新しい「コンピュータ方式」についてはわずか2回というのは、理にかなった配分ではないように見えると思います。しかし、それにはそれなりの意味があります。

「トミイ方式」というのは、すでに機会あるごとに繰り返し説明してきましたが

収集 ⇒ 分類 ⇒ 収納

という工程から成り立っています。これは、「カード方式」であっても「コンピュータ方式」であっても同じです。ただ違うのは、最後の工程である【収納】だけで、「カード方式」は「収集」・「分類」した英文データをカードに記載してカードケースに「収納」する方式であり、「コンピュータ方式」は「収集」・「分類」した英文データをコンピュータに「収納」する方式であるということだけです。したがって、「カード方式」について5回にわたって説明してきたというのは、「収集」・「分類」した英文データをカードに記載してカードケースに「収納」するというすべての工程を説明したからで、「コンピュータ方式」が2回で済むのは、「収集」・「分類」の説明は割愛し、「収集」・「分類」した英文データをコンピュータに「収納」する工程についてのみ説明するだけで済むからです。つまり、ここでは、「収集」・「分類」の説明は割愛し、コンピュータへの「収納」についてのみ説明することにします。ただし、理解しやすいように、「カード方式」で使用した英例文を使って説明していきます。

もう一つの理由は、カード時代からコンピュータ時代に移ったとはいえ、時と場所と状況を考えると、すべてのデータが必ずしもコンピュータに収納できるものではなく、カードに収納した方がはるかに良い場合が多くあります。したがって、カード時代からコンピュータ時代に移ったとは言っても、いまだにカード方式を使っている、いわば、「コンピュータ・カード併用時代」であるということです。そこで、ここでは、「コンピュータ方式」を切り離し、純粋の「コンピュータ方式」による英文データの収納方法についてのみ説明します。

ただ、それには大きな前提があります。すなわち、元の原稿はすべて電子化されているものでなければならないということです。しかし、そのこと自体は、キーボードから英文で打ち込んだり、元原稿をOCRにかけて電子データ化したりすれば解決できることであって、さして大きな前提となるものではありません。それよりもはるかに、はるかに大きな大前提というのは、先に、収集・分類したすべての英文データを入れていく分類表――これを、「お座敷」と呼んでいます――ができていなければならないということです。

それには、以下に示す2つの方法があります。

(1) 自前のデータベース(分類表)を作る方法
(2) 既存のデータベース(分類表)を使う方法

(1) は、筆者が40年近く前から始めたように、自分自身の目的に沿って、必要とされる英文データをコツコツと集めていき、かなりの量のデータが集まった時点で分類し、分類表を作成する方法です。筆者の経験では、英文データが10,000点から20,000点くらいになると、かなり精度の高い分類ができると思います。この方法は、時間と根気が必要になりますが、学習機能や活用機能の極めて高い方法です。

(2) は、筆者が「トミイ方式」を始めようとしている人たちのためにEXCELで作成した分類表で、7つの大分類から始め、そのそれぞれに対し、中分類、小分類、細分類などに分類している表で、理解しやすいように、ところどころに、サンプルとして初期データが収納されている、EXCELで作成した分類表――これを「簡易式分類表」と呼びます――を使用する方法です。

それでは早速、収集した英文データを「簡易式分類表」に収納する方法を、第40回から第44回までに使用した「データカード」を使って説明します。「トミイ方式」では7つの分類がありますので、あらかじめ、「簡易式分類表」の下部の「シート見出し」を大分類として左から順に「ABC順」、「50音順」、「表現別」、「品詞別」、「構文別」、「数量表現別」、および「その他」としておきます。

「簡易式分類表」を目にすることなくそこにデータを収納していくのはむずかしいと思いますが、ご希望の方には、この「簡易式分類表」をお求めいただける方法を考えていますので、より確実に理解したいと思われ方は筆者まで直接にご連絡ください。とりあえずは、縦方向の「列」には、左から順に「中分類」、「小分類」、「細分類」、「細々分類」、「極細分類」、「英例文」、「和訳文」と並んでおり、横方向の「行」には、それぞれの項目が並んでいると想像してお読みください。

データカード1

これは前置詞 in の収集です。第40回をご参照ください。
①「シート見出し」の「品詞別」を開きます。
②「中分類」として「前置詞」を選びます。
③「小分類」として「単体前置詞」を選びます。
④「細分類」として「in」を選びます。
⑤「細々分類」として「~の」を選びます。
⑥ 元の英文を「英例文」欄に入れます。

元の英文が電子化されたデータならばcopy & pasteで、電子化されていないデータならばキーボードからの打ち込みで、「英例文」欄に入れます。この工程はすべての英文データに共通しますので、これ以降は説明は省略します。

「和訳文」を加えるかどうかはご自身で判断していただかないといけません。翻訳しながらデータ収集する場合には、その時間はないと思います。それに、これは英文データを収集することにありますので、和訳文を入れる必要はないでしょう。ただ、「出典」および「収集年月日」は入れておいたほうがよいと思います。

もし、最初から「細々分類」までは必要としない場合、またはできない場合には、ご自身でどの段階までの分類を必要とするか、またはできるかを判断し、② の段階、③の段階、④の段階で1行挿入し、挿入したその「行」の「英例文」の「列」英文データを入れます。

データカード2

これは、無生物主語構文の収集です。第41回をご参照ください。

①「シートの見出し」の「構文」を開きます。
②「中分類」として「無生物主語構文」を選びます。

最初のうちはここまでで良いと思います。この段階で1行挿入し、元の英文を「英例文」の「列」に入れます。後日、無生物主語構文がたくさん集まった時点で、無生物主語構文自体を学習し、「簡易式分類表」の中の分類と照らし合わせながら「英例文」の「列」に入れます。

データカード3

これも、前置詞 in の収集です。第41回をご参照ください。

①「シート見出し」の「品詞別」を開きます。
②「中分類」として「前置詞」を選びます。
③「小分類」として「単体前置詞」を選びます。
④「細分類」として「in」を選びます。
⑤「細々分類」として「~中」を選びます。
⑥ 元の英文を「英例文」の「列」に入れます。

今回はここまでとし、次回は「データカード4」から説明します。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第44回

2013年 2月 18日 月曜日 筆者: 富井 篤

7 英文データの実践的収集方法(カード方式)・5

(c) 複文一葉式(続き)

今回は、3つ目のパラグラフを使い、そこから、9個のデータを採取してみようと思います。

すでに過去のものとなっている「カード方式」にここまで執拗に拘るのには、次のような理由があります。

・確かに「カード方式」を追究しているようではありますが、実際には、「カード方式」にかこつけて、「採取対象データ」を、できる限り広く、深く説明することにあります。

・「トミイ方式」が「コンピュータ時代」に移行してきたとはいえ、まだ、英文原稿がすべて電子化されているというものではない現実や、たとえ英文原稿が電子化されていても、環境により、英文データをいつでもどこでも自在にコンピュータに収納できるものではないという状況がたくさんあるという現実などを考慮すると、英文データをカードに収納したほうがよいという状況がたくさんあります。

それでは、3つ目のパラグラフから優先順序の比較的高いものから9個選択し、データカード13データカード14データカード15を「添付-H」に、データカード16データカード17データカード18を「添付-I」に、そして、データカード19データカード20データカード21を「添付-J」に示します。

atomii44h.jpg

データカード13
理由:rangeを「範囲」として採ってみました。ここでは、range from 2 to 25 Aとして「電流の範囲」と表しています。この例でも分かるように、範囲を表す場合、始点――この場合は2――には単位をつけず、終点――この場合は25――にのみ単位をつけます。ただ、始点と終点の単位が異なる場合には、下記のように両方に単位をつけます。
例 Operating frequencies can range from 10 kHz to 3 MHz or more.
機能:学習、活用、制作・発表の順です。
場所:大分類は「表現別」です。中分類は「範囲」です。

データカード14
理由:noninductive を「反意語」として採りました。普通の英和辞典のほとんどは、“noninductive は inductive の「反意語」”という表示は出ていますが――もちろん、それさえ出ていない辞書もたくさんありますが――その反対の、“inductive の「反意語」は noninductive である”という表示が出ている辞書は極めて少ないです。たとえば、possible などのような易しい言葉は、「その反意語は impossible である」と誰にでも容易にわかりますが、symmetry とか moral などとなると、反意語を作る接頭辞はすぐには出てきません。dis だったかな、im だったかな、in だったかな、non だったかな、un だったかな、などといろいろ迷ってしまします。実は、これら2つの言葉の反意語は、単に a をつけて asymmetry とか amoral でよいわけです。このように反意語が出てきたら、片っ端から採取し、反意語順ではなく、反対を表す接頭辞を取り除き、肯定語をアルファベット順に並べておくようにします。
機能:学習、活用、制作・発表の順です。
場所:大分類は「その他」です。中分類は「反意語」です。

データカード15
理由:このカードは configuration として採ってあります。この言葉は、大方の辞書に載っている訳語では訳せないことがよくある単語ですので、将来のために、このまま「アルファベット順」に入れておくとよいです。
機能:学習、活用、制作・発表の順です。
場所:大分類は「アルファベット順」です。

atomii44i.jpg

データカード16
理由:このカードは available として採ったもので、この言葉もいろいろな意味や用法のある単語で、大方の辞書にある意味や訳語では訳せないことがよくある単語です。このデータカードの用法は、比較的簡単ですが、この言葉が、前置詞と一緒に使われている場合には、その前置詞によって、意味がすべて変わってきますので、必ず採取しなければなりません。細分類については、下の「場所」に述べてある説明をご参照ください。
機能:学習、活用、制作・発表の順です。
場所:大分類は「アルファベット順」です。

まだ1枚目ですから、下に示すような分類はできませんが、やがて、100枚、200枚、300枚と集めってくると、下のような分類ができるようになります。
1 客語的用法
 (1) be動詞 + available
 (2) make (become, remain, etc.) + available
 (3) be動詞 + available + 前置詞
2 修飾語的用法
 (1) available ____
 (2) ____ available
3 「____は市販されている」
 (1) ____ + be動詞 + commercially available
 (2) ____ + be動詞 + available commercially
4 「市販されている____」
 (1) commercially available ____
 (2) ____ commercially available
 (3) ____ available commercially

ちなみに、この「データカード16」は、上の1 (1)の用法の例です。その1行下にある available は1 (3)の用法の例です。

データカード17
理由:「トミイ方式」では、百数十個あると考えられる「物理量」を、「数量表現別」の中に収録しています。「物理量」とは、第34回(2012年10月1日公開)で説明したように、温度、湿度、速度、圧力、電圧、電流、価格、高さ、幅、長さなどなど、数値+単位で表される、英語では「数」としてはなく、「量」として取り扱われるものです。ここでは、current すなわち「電流」の表現として採取しています。10 mA to 5 A というように電流の値に範囲がある場合には、currents というように複数形で書くことも忘れないでください。すでにお気づきだと思いますが、10 mA to 5 A は、始点と終点の単位が違うため、始点にも単位記号が入っています。
機能:学習、活用、制作・発表の順です。
場所:大分類は「数量表現別」で、中分類は「物理量」、小分類が「電流」です。

データカード18
理由:これは「数量表現別」の中の「概略」の表現です。「概略」を表す表現には、下に示すようにたくさんありますが、in the order of はそのうちの一つです。
 例:about,approximately,almost,nearly,roughly,around,some,or so,close to,in the neighborhood of,in the vicinity of,in a matter of,in the order of
機能:学習、活用、制作・発表の順です。
場所:大分類は「数量表現別」で、中分類は「数量語句周りの表現」、小分類が「概略」、細分類が「in the order of」です。

atomii44j.jpg

データカード19
理由:「数量表現別」のデータがつながってしまいましたが、これも「数量表現別」のデータです。ここでは、voltage すなわち「電圧」の表現として採取しています。from 9 to 48 Vdc というように電圧の値に範囲があるため、voltages というように複数形になっています。この例文では、始点と終点の単位が同じですから、始点には Vdc という単位はついていません。なお、日本語では、よく「交流100V」とか「直流24V」などといいますが、英語では、dc とか ac の記号は、必ず数字の後ろ、厳密にはVの後ろ、につけることも、この英例文から学びましょう。
機能:学習、活用、制作・発表の順です。
場所:大分類は「数量表現別」で、中分類は「数量語句周りの表現」、小分類が「概略」、細分類が「up to」です。

データカード20
理由:もう1つ「数量表現別」のデータです。この up to 5 A というのは、下から上に向かって「まで」を表すもので、「最大」と考えることもできる表現です。ちなみに、上から下に向かって「まで」を表す英語は down to です。
機能:学習、活用、制作・発表の順です。
場所:大分類は「数量表現別」で、中分類は「数量語句周りの表現」、小分類が「最大・最小」、細分類が「up to」です。

データカード21
理由:ここでは、副詞(completely)+ 過去分詞(transistorized)+ 名詞(proximity switches)に注目して採取してみました。要するに、日本語で

どのように ~された 何々

という場合、英語でも、全くそれと同じ語順で書くことができるということを確認するためです。すなわち、日本語と全く同じ語順で

完全に(completely) トランジスタ化された(transistorized) 近接スイッチ(proximity switches)

と書けるわけですが、この語順を知らないと、初心者のお好みの which を使って

proximity switches which are completely transistorized

となってしまうわけです。
機能:学習、活用、制作・発表の順です。
場所:大分類は「品詞別」で、中分類は「副詞」、小分類が「副詞+過去分詞+名詞」です。過去分詞の代わりに現在分詞の例や形容詞の例もあります。

第40回から今回の第44回まで、5回にわたりデータカードを21枚作成してきましたが、7つの大分類毎の枚数は、「添付-A」にある、1つの英文から2件採取した分を含めて、下記の通り23枚採取しました。
「アルファベット順」:4枚
「50音順」:1枚
「表現別」:3枚
「品詞別:6枚
「構文別:1枚
「数量表現別」:6枚
「その他」:2枚

次回からは、8 英文データの実践的収集方法(コンピュータ方式)に入ります。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第43回

2013年 2月 4日 月曜日 筆者: 富井 篤

7 英文データの実践的収集方法(カード方式)・4

(c) 複文一葉式(続き)

○ 上級者用方式
前回、極めて簡単な、「初心者用方式」について説明しました。今回は、理解度も高く、かつ「トミイ方式」の持つすべての機能、すなわち、活用機能、学習機能、制作・発表機能のすべてを目的としている読者を対象に説明をします。したがって、当然のことながら、「初心者用方式」と「上級者用方式」との間には、無限のバリエーションがあることをご理解いただき、ご自身の理解度や目的に合ったデータ収集をしていただくとよいと思います。
注:「活用機能」、「学習機能」、および「制作・発表機能」については、この連載の第13回(2011年12月5日公開)第14回(2011年12月19日公開)第15回(2012年1月9日公開)をご参照ください。

今回は、前回(第42回)で使用した「添付-B」に示した3つあるパラグラフのうち、2つ目のパラグラフを使って説明していきます。3つ目のパラグラフは、次回、第44回で取り上げます。

作業は次の通りです。

(1) まず、前回使用した「添付-B」に示すようにパラグラフ単位に切り取ります。

(2) 切り取ったパラグラフをカードに貼り付けます。「添付-C」参照。これを「マスターカード」と呼びます。ここまでは、前回の「初心者用方式」と同じです。

(3) コピー機を使って「マスターカード」から必要な枚数だけコピーします。「添付-E」参照。これを「スレイブカード」と呼びます。最初に使用した3つのパラグラフすべてが表示されていますが、ここで、実際に使用するのは、真ん中のパラグラフです。
 注:詳細な計算根拠は割愛しますが、「必要な枚数」とは、細かく採取していけばきりがありませんが、このサンプルのような英文の場合、経験的に採取する英文データを1行当たり2個とし、それに1パラグラフ当たりの行数を掛けて得られる英文データの数のことをいいます。このサンプル・パラグラフは、約9.5行ありますので、これに2を掛けると、「必要な枚数」は約19枚ということになります。もちろん、あるときは枚数が足りなくなることもあり、またあるときは余ってしまうこともありますが、足りなければさらに焼き増しすればよいでしょうし、余れば、さらに細かくデータを採取すればよいことになります。それは、経験を積みながら、ご自身にあった「必要な枚数」を見つけていくとよいと思います。

(4)「スレイブカード」を1枚ずつ取り出し、最初から順番に採取したいデータを拾っていきます。その作業は、前回説明した「初心者用方式」のステップ(3)とほとんど同じです。ご参考までに、以下に引用します。このようにしてできたカードを「データカード」といいます。

(3) 採取したい英文データの下に赤でアンダーラインを引き、カードの上部には、分類名を同じく赤で記入します。

分類名は、必ずしも、大分類、中分類、小分類すべてについて記入する必要はなく、自分で理解・記憶できる分類名は省略してもかまいません。

注:せっかく「スレイブカード」を19枚作成したわけですので、このパラグラフから19個のデータを採取すべきなのですが、紙幅の関係でそのすべてをここに表示することができませんので、なるべく、まんべんなく7つの「大分類」すべてにわたる代表的なデータを6個選んで採取することにします。

「添付-F」にテータカード7,8,9の3個を、そして、「添付-G」にテータカード10,11,12の3個をそれぞれ載せてあります。

atomii43fs.jpg

データカード7
理由:これは、前回、「データカード4」で採取した「種族全体」を表す表現と同じで、無冠詞の複数名詞という表現方法です。説明は、すべて前回、「データカード4」をご参照ください。
機能:学習、活用、制作・発表の順です。
場所:大分類は「品詞別」です。中分類は「冠詞」です。無冠詞も冠詞のうちの1つという考え方です。

(5) 同じように、2枚目の「スレイブカード」を取り出し、「データカード8」を作成します。これは、複数個ある語や句や節や文を列挙するときの表現に注目して作成した「データカード」です。

データカード8
理由:複数個ある語や句や節や文を列挙するときの表現方法には、まず大きく分けて
○主文の中に列挙項目を入れる場合(「データカード8」はこれに該当します)
○主文とは別に独立させて列挙項目を羅列する方法
の2つがあり、そのそれぞれは、さらに何十という細分類、細々分類、極細分類に分けられます。今はまだ1つだけですので、とりあえずは大分類が「その他」の中に入れておくだけで十分でしょう。
機能:学習、活用、制作・発表の順です。
場所:大分類は「その他」です。中分類は「列挙の仕方」になります。

(6) 次は3枚目の「スレイブカード」を取出し、「データカード9」を作成します。

データカード9
理由:solid-state switch で採ってみました。技術文では、よく solid-state という言葉が冠されている単語を見かけます。意味的には、「solid 状態の」ということであり、そのため、多くの場合、「個体~」という言葉に使われてます。それ以外の意味にも使われていることがありますので、solid-state という言葉がついている表現は、なるべく多く採取するとよいと思います。
機能:学習、活用、制作・発表の順です。
場所:大分類は「アルファベット順」です。その中の solid-state という場所に置きます。

次は、「添付-G」に載せられている、テータカード10,11,12の3個です。

atomii43g2.jpg

データカード10
理由:an object と the object の両方にアンダーラインが引いてあります。冠詞の一番基本的な用法に「最初に出てきた名詞には a,二度目に出てくるときはthe」というものがありますが、その用法に注目して採取したデータです。技術文には、そのような簡単な例ばかりでなく、もっと複雑な例もありますが、この基本ルールなしには理解できないことです。
機能:活用、学習、制作・発表の順です。
場所:大分類は「品詞別」です。中分類は「冠詞」、小分類は「最初の a と二度目の the」でよいでしょう。

データカード11
理由:分数の表し方にはいろいろありますが、この a fraction of ____ というのは「____の何分の1」という程度の意味を持つもので、この例では、「1インチの何分の1くらいの」というものです。いくつかある分数の表現のうちの1つとして採ってみました。
機能:活用、学習、制作・発表の順です。
場所:大分類は「数量表現別」で、中分類は「分数」です。

データカード12
理由:type という単語は、慣れない人は「形」とか「型」などと訳してしまいますが、技術文では「種類」という意味で使われている場合が多いです。ここでは、type を「表現別」の「種類」に採ってみました。
機能:活用、学習、制作・発表の順です。
場所:大分類は「表現別」で、中分類は「種類」です。

これで、「収集」、「分類」、「収納」の全工程が終わります。

次回は、3つ目のパラグラフを使い、そこから、9個のデータを採取してみようと思います。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第42回

2013年 1月 21日 月曜日 筆者: 富井 篤

7 英文データの実践的収集方法(カード方式)・3

(c) 複文一葉式

前回は、「1枚のカードには絶対に1件の英文データしか記入しない」という「(b) 1件一葉式」について述べました。

しかし、この方式だと、データの行き詰まりには直面しませんでしたが、カードに空きスペースができ、非経済的でした。さらに、この方式で暫く続けていくと、以下に示すいくつかの理由により、また新たな壁にぶつかってしまいました。それは、ある一つの文章の前後にある文章との連続性の途絶です。

以下は、この連載の第11回――2011年11月7日公開―から引用したものです。

○ 前の文章との関連性から
英文では、前の文章のある名詞を受け、いきなり It とか They 等で文章が始まることがよくあります。その時、その It や They が何を表しているかわからないと文章全体がうまく訳せないことがあります。そのため、1文だけで文章を収集しておくと、後々、その処理に困ることになります。これを回避するため、できる限り前の文章も一緒に収集しておいた方がよいことになります。

○ 前後の文章との関連性から
よく、英語は「同一文の中ではもちろんのこと、隣接した文の中でも、同じ言葉や言い回しを使うことは、筆者のインテリジェンスの低さを表す。したがって、できる限り、表現にはバライエティを富ませた方がよい」と言われています。「トミイ方式」では、この表現のバリエーションも収集対象になっていますので、この目的のためには、できる限り多くの前後の文章も一緒に収集しておいた方がよいことになります。

この「表現のバリエーション」にご興味をお持ちの方は、「技術英語構文辞典(富井篤著)」(三省堂)をご参照ください。「2.4 表現の変化と統一」(p.352からp.378まで)に詳しく書かれています。

○ 全体の文脈から
件(くだん)の言葉や言い回しが使われている文が、どのような文脈の中で、どのように使われているか理解するためにも、カードのスペースが許す限り、できるだけ多くの前後の文章も一緒に収集しておいた方がよいことになります。

このようないろいろな理由に促され、どうしても、複数の文を1枚のカードに収集する必要性に迫られてきます。そこで、行きついたのが、次に説明する「複文一葉式」です。

(c) 複文一葉式

これは、上にも述べたように、件(くだん)の言葉や言い回しが使われている文章に対し、その前後にある文章を、カードのスペースが許す限り、たくさん、できればパラグラフ単位で収集する方式です。これには、1つのパラグラフから1つか2つぐらいのデータを収集する、ごく簡単な方式から、1つの文章から複数個、パラグラフ全体からは20個とか30個のデータを収集するような、きわめて高度な方式までいろいろあります。前者を、「トミイ方式」を始めたばかりの「初心者用方式」と定義するならば、後者は、「トミイ方式」の「上級者用方式」と定義することができます。この2つの方式は、読者の個人的な環境や条件、例えば、「トミイ方式」の熟練度や理解度や「トミイ方式」を活用する目的などにより分けられるもので、これらの条件や目的が低い人は「初心者用方式」に属し、高い人が「上級者用方式」に属することになります。「初心者用方式と「上級者用方式」とに分けて、順に説明していきます。

いずれの方式にしても、1枚のカードに複数の文からなるパラグラフ単位に収納するとなると、もはや、手書きは無理になります。何らかの方法で、複数枚のカードを作成しなければならなくなります。

○ 初心者用方式

「トミイ方式」の経験が浅いため、1つのパラグラフから採取する英文データの数が、例えば3枚で十分である場合を仮定して説明します。
注:ここで使用している原稿は、アメリカのPenton社が出版していたElectric Motors and Controlsという小冊子の中のProximity Switchesについての冒頭の一部分です。

(1) まず、英語の原稿を3枚コピーし、それを「添付-B」に示すようにそれぞれ3枚ともパラグラフ単位に切り抜きます。

atomii42b3.jpg

(2) 切り抜いたパラグラフをそれぞれカードに貼り付け、「添付-C」に示すようにそれぞれのパラグラフが貼られたカードを3枚作ります。これを「マスターカード」といいます。その際、カードの下部には、出典(原稿の名前。名前が長い場合には、適宜、短縮して符号化します)、採取年月日、ページ番号、位置などを記入しておきます。

atomii42c2.jpg

(3) 作成した3枚のカードのうち、最初の1枚を取出し、採取したい英文データの下に赤でアンダーラインを引き、カードの上部には、分類名を同じく赤で記入します。前回でも説明しましたが、これを「データカード」といいます。この作業を、残りの2枚のカードについても繰り返します。このようにして、「データカード4」、「データカード5」、および「データカード6」を作ります。詳細は、「添付-D」に示します。

atomii42d2.jpg

分類名は、必ずしも、大分類、中分類、小分類すべてについて記入する必要はなく、自分で理解・記憶できる分類名は省略してもかまいません。記入した3つの英文データは、1例を示したものです。

上に示した3枚の「データカード」につき、これらの英文を、どのような目的で採取したのか、また、どのような場所に収納したらよいのかなどを、「理由」、「機能」、「場所」の3つに分け、下に簡単に説明します。

データカード4
理由:この不定冠詞Aは、学校文法によく出てくる「種族全体」を表す名詞につけるもので、何ら限定するものではなく、この例でいうならば、「一般的にいって、近接スイッチなるものは」とういう感じのものです。これと同じ表現方法に、無冠詞の複数名詞という表現方法がありますが、「添付-B」の2つ目の例文の文頭の Simple proximity switchesがそれです。この種のものは、1例採取すればそれでよいというものではなく、複数例採取することにより、自分の身につくものであり、さらに、「不定冠詞+単数名詞」と「無冠詞+複数名詞」は、同じと考えてよいということになっているが、果たして本当にそうであるかとか、どちらの例が使用頻度が高いかということを学習するためにも、出くわした例文はすべて採取する習慣をつけることをお勧めします。
機能:学習、活用、制作・発表の順です。
場所:大分類は「品詞別」です。中分類は「冠詞」です。

データカード5
理由:これは、「~の有無」という意味です。「有無」という英語には、これ以外の言葉もありますが、一番しっくりする英語はこれです。中には、この言葉を載せていない和英辞書もありますので、この英文データを採取しておくと、和英翻訳の時にとても役に立ちます。
機能:活用、学習、制作・発表の順です。
場所:大分類は「50音順」です。

データカード6
理由:provideという言葉は、非常に意味の広い言葉で、そのため非常に頻繁に使われる言葉です。極端な言い方をすると、出てくるたびに違う日本語を当てはめないといけないような言葉です。そのため、しばらくの間、おそらく例文が数百点集まるまでは、出てくるたびに採取するくらいの意気込みが必要です。
機能:学習、活用、制作・発表の順です。
場所:大分類は「アルファベット順」です。

(4) この3枚の「データカード」は、とりあえずは、カードが入る厚紙の箱を準備し、その中に収納します。まだ3枚ですが、最低限7つの大分類だけはしておかなければなりません。それには、カードを7枚使い、それぞれに

アルファベット(簡単に、ABC でも可)
50音
表現
品詞
構文
数量表現
その他

とやや大きめのインデックスに大書し、7枚のカードに少しずつずらして貼り、仕切りを作り、その順に並べておきます。「データカード4」は「品詞」の中に、「データカード5」は「50音」の中に、そして、「データカード6」は「アルファベット」の中に入れておきます。

これで、「収集」、「分類」、「収納」の全工程が終わります。

これまでは、必要データ数を3件として説明してきましたが、5~6枚くらいならば、多少、作業が多くなるかもしれませんが、この方法を使うことができ、費用対効果も、さほど落ちないと思います。

次回は、「上級者用方式」を取り上げることにします。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

大規模英文データ収集・管理術 第41回

2013年 1月 7日 月曜日 筆者: 富井 篤

7 英文データの実践的収集方法(カード方式)・2

(b) 1件一葉式

今回は、前回に続いて「1件一葉式」の「データカード2」からです。

データカード2

これは、「無生物主語構文」といって、日本語にはなく、英語だけに発達した構文です。

上部には「無生物主語構文」としか書いてありませんが、実際には

大分類が「構文別」、中分類が「無生物主語構文

です。しかし、大分類が「構文別」であることは分かっていますので、それは省略しています。また、小分類、細分類と分類されていくのですが、最初から過度に分類していっても実質的な意味はありませんので、そこまでは分類していません。

中ほどに英文を書き込み、該当する句、ここでは the addition of additives に赤でアンダーラインを引きます。

下部に記入する出典などは、「データカード1」と全く同じです。

ここで、「トミイ方式」とは直接関係はありませんが、これからも何回か出てくると思いますし、英和か和英かにかかわらず翻訳にとって非常に大事ですので、「無生物主語構文」について触れておきます。

「無生物主語構文」というのは、一言でいうと、「モノ」や「ヒト」ではなく「コト」を主語に取る構文のことで、主に「因果関係」を表現するときの構文です。日本語にはありませんので、英和翻訳のみならず、和英翻訳にも非常に大事な構文ということになります。この「無生物主語構文」を上手に使って和訳すると自然な、翻訳臭のない日本語に訳すことができます。また、この構文を和文英訳で巧みに活用すると、辞書や文法書から飛び出してきたような英文ではなく、格調の高い英文を書くことができます。

この「無生物主語構文」を英文と和文で比較してみると、次の一言でいうことができます。
要するに、英語は

無生物の主語(「コト」) + 他動詞 + 目的語

いっぽう、日本語は

条件節、主語 + 自動詞

です。

すなわち、英語では

何々であることは + 何々を + 何々させる

と書きますが、日本語では

「何々が何々だと(原因)」または「何々が何々なので(理由)」 + 何々は + 何々する

とします。すなわち、

英語の「何々であること」の部分を「何々が何々だと(原因)」または「何々が何々なので(理由)」というように「節」に
英語の「何々を」という「目的語」を「何々は」というように「主語」に
英語の「何々させる」という「他動詞」を「何々する」という「自動詞」に

それぞれ置き換えると自然な日本語になります。これからたくさんの英文に接していると、きっと、おびただしい量の「無生物主語構文」に触れることがあると思います。そのために、実はここは「無生物主語構文」を解説する場ではないのですが、いくつかの代表的な「無生物主語構文」のパターンを示します。

1 形容詞パターン
  主語が「形容詞」+「名詞」(どのような何々は) ⇒ 何々がどのようだと(どのようなので)

2 名詞+名詞パターン
  主語が「名詞」+「名詞」(自動詞から転じた名詞)(何々の何々は)
   ⇒ 何々が何々すると(何々するので)

3 名詞+名詞パターン
  主語が「名詞」+「名詞」(他動詞から転じた名詞)(何々の何々は)
   ⇒ 何々を何々すると(何々するので)

4 動名詞パターン
  主語が「動名詞」+「名詞」(何々を何々するということは) ⇒ 何々を何々すると(何々するので)

5 show thatパターン
  主語が「無生物」(動詞から転じた名詞)+show [indicate、demonstrate、prove、revealなど] that(何々はthat以下のことを示している) ⇒ 何々の結果、that 以下のことが分かった

6 presenceパターン
  主語に「presenceやabsenceを含む名詞」(何々の存在は、または、不在は) ⇒ 何々があると(または、ないと)

これ以外にもたくさんのパターンがありますが、ご興味のある方は、拙著「技術英語構文辞典」(三省堂)をご覧ください。

データカード3

これも、前置詞inの用法を学習するために採取した英文です。この場合には

are in common use

に焦点を当てて収集したものです。すなわち

be動詞 + in + 動詞から転じた名詞

です。そのうち、大分類が「品詞別」、中分類が「前置詞」、小分類が「in」までは「データカード1」と同じですが、その下の階層である細分類としては「」ではなく「~中である」の中に入ります。

日本語に、よく「~している」とか「~されている」という表現が出てきますが、これを英訳しようとするとき、初心者はほとんどの人が現在進行形で表現してしまいます。しかし、「~している」とか「~されている」という表現には、(1)「動作・行為」を表しているものと(2)「状態」を表しているものがあります。(1)は、確かに現在進行形で表現してもよいのですが、(2)は「状態」を表す表現を用いなければなりません。その表現が

be動詞 + in + 動詞から転じた名詞

です。似た表現は、以下のようにいろいろあります。

be in operation 稼働している、稼働中である
be in production 生産されている
be in contact with ~ ~と接触している
be in motion 動いている、運動中である

「1件一葉式」とはいかがなる方式であるかを紹介するために英例文を示したわけですが、英例文の中身に膨大な紙面を使う結果となってしまいました。しかし、これも、「トミイ方式」の大事な部分ですので、「トミイ方式」についての理解をより深めていただくためには必要であったと思います。

データカード1」でも、同じ英例文が

大分類が「品詞別」、中分類が「前置詞」、小分類が「in」と
大分類が「表現別」、中分類が「増加」、小分類が「名詞形

の2か所に入れることができるといいましたが、この「データカード3」もup to 3600 hpに焦点を当て

大分類が「数量表現別」、中分類が「数量語句周りの表現」、小分類が「最高

とすると2つ目の英文データとして収集することができます。この部分には、「データカード3」と同様、up to 3600 hpに赤の点線でアンダーラインを引いてあります。

次回は (c) 複文一葉式 を取り上げます。

【筆者プロフィール】

富井篤(とみい・あつし)
技術翻訳者、技術翻訳指導者。株式会社 国際テクリンガ研究所代表取締役。会社経営の傍ら、英語教育および書籍執筆に専念。1934年横須賀生まれ。
主な著書に『技術英語 前置詞活用辞典』、『技術英語 数量表現辞典』、『技術英語 構文辞典』(以上三省堂)、『技術翻訳のテクニック』、『続 技術翻訳のテクニック』(以上丸善)、『科学技術和英大辞典』、『科学技術英和大辞典』、『科学技術英和表現辞典』(以上オーム社)など。

次のページ »