コーパスから隠れた意味を探る
コーパスを用いた言語研究において,語の使用の研究が飛躍的に進歩したのは,「コンコーダンサー」(concordancer)と呼ばれる検索プログラムのおかげである。このプログラムを使ってコーパスから特定の語を検索すると,検索対象語(keyword)を行の中央に配置し,その左右に文脈を添えた検索結果が行単位で表示される。この表示全体を「コンコーダンス」(concordance),別名 “KWIC” (「クイック」〈 KeyWord In Context)と呼ぶ。コンコーダンスは,特定の語がどのような語と結合するのか,その典型的なパターンを目に見える形で示してくれる。そして検索対象語の前後に現れる文脈を精査すると,母語話者でも気づかなかった言語事実に気づくことがある。この連載では,コンコーダンサーでコーパスを分析すれば,語の振る舞いについてどのようなことが明らかになり,それがどのよう形で『ウィズダム英和辞典』の記述になったかを紹介してゆくことにする。なお,最初に「三省堂コーパスとは?」も併せてお読みいただきたい。
第1回目は動詞causeをとりあげる。最初にこの語を三省堂コーパスで検索した結果の一部を示す。11340行のコンコーダンスから1000行を無作為に抽出し,causeの右側1語目の語を基準にアルファベット順に並べ替えたものである。
causeの右側に生じる名詞に注目して上から下へと見ていくと, damage, death, diseaseが目的語として頻繁に使われていることがわかる。さらにcauseの全データに対して右側1語目に出現する名詞の頻度を10位まで調べると,problems, cancer, trouble, disease, damage, death, pain, heart (disease/failure), harm, concernであった。上で示した検索結果とこれらの語を見て気づくことは,名詞の示す内容が好ましくない出来事である点で,意味的に共通していることである。したがってcauseは単に「〈出来事〉を引き起こす」を意味するのではなく,「〈問題・病気・被害などの好ましくない事態〉を引き起こす」ことを意味する。『ウィズダム英和辞典』のcause (動) (他) 1aの語義をご覧いただきたい。
「A〈良くない出来事など〉」と記してあるだけのことだが,この記述に至るまでには上述したようなコンコーダンサーによるコーパス分析が行われたのである。