ウェブコーパス徹底活用

第三回「英文校正サイトNativeChecker」

筆者:
2007年9月18日

今回は、英作文に役立つ英文校正ツールの紹介です。

英作文で一番やっかいなのは on, with, for, of などの前置詞です。
受験勉強で散々やった超基本的な表現でもときどき悩んでしまいます。
例えば「木製」の訳が「made of wood」なのか「made from wood」なのかなど。

こういうときはウェブ検索サイトが便利で、
前置詞を置き換えたパターンで次々と検索していけば、
検索ヒット数で確からしさが分かります。
しかし、「of」か「from」かなどの二択ならともかく、
候補が曖昧なときには試行回数が増え、
どう考えても面倒くさいです。

このような作業を自動化したのが、
浜本階生さんによる「NativeChecker」です。

英文校正サイト [NativeChecker]
//native-checker.com/

前置詞だけでなく、
スペルミスや時制などの文法チェックや、
類義語の提示なども行ってくれます。
今年の春から夏にかけて開催された、
Yahoo! JAPAN WEB APIコンテストで賞を取っているすぐれものです。

基本的な使い方を簡単に説明しておきます。
入力サンプルにもある “made by wood” で見てみましょう。
「made by wood」と入力すると、
ウェブでの出現頻度と、
「made (過去分詞) by (前置詞/従属接続詞) wood (名詞(単))」と
品詞が振られてものが表示されます(スペルミスがあれば波線が引かれます)。

ここで、
前置詞の部分を様々なバリエーションに換えて出現頻度を調べたい場合、
「by」をクリックして出てくるメニューで「その他の表現」を選択します。
すると図1のように、
いろいろな前置詞によるパターン(とその出現頻度)が表示されます。

サムネイル
図1

また、
「made」をクリックすると、
「類義語」や「活用形」などのバリエーションが選択できます。
図2は、made の類義語を展開したパターンで出現頻度を調べたものです。

サムネイル
図2

ウェブでよく現れる表現ほど自然な英語表現に近いとみなす、
つまり、ウェブをコーパスとみなすことにより、
ここまで便利なツールができてしまうとは驚きです。
可能性のある英語表現を片っ端から自動で調べてみるという大胆な方法が、
この用途にぴたっとはまっていますね。

筆者プロフィール

たつを

奈良先端科学技術大学院大学卒,工学博士。
専門は自然言語処理技術やテキストマイニング。
ブログ「たつをのChangeLog」を10年以上運営。

編集部から

たつをさんのコラムを全6回で掲載します。第1回は8月20日の掲載でした。次回(第3回)は9月18日(火)に掲載の予定です。ご期待ください。