« 明日は何の日:8月27日 - 明日は何の日:8月28日 »

学習者コーパス“NICE”を検索する (1)

2008年 8月 26日 火曜日 筆者: 阪上 辰也

学習者コーパス入門 第8回

前回前々回と、NICE を使った学習者の特徴を分析する事例を紹介しました。専門的な内容を含んでいたため、やや分かりにくい点があったかもしれません。今回からは、どのような操作によってデータを加工・検索するのか、その具体的な手順を見ていきたいと思います。

今回は、基本的な検索の方法について説明しますが、ソフトウェアとして、「サクラエディタ」(無償)を使用します。このサクラエディタには、「Grep」という検索機能があり、検索した表現の一覧を表示することができます。

こうした言葉だけでの説明では分かりづらい部分が多いと思いますので、Web ならではということで、操作の模様を記録した動画(スクリーンキャスト)を用意しました。こちらのリンクをクリックしてください。

簡潔に操作手順を述べると、

  1. 1. メニューから「検索」を選び、その中の「Grep」をクリックする。
  2. 2. 条件(=検索したい表現)、検索するファイル、検索するフォルダを指定する。
  3. 3. 検索する表現を入力し、「検索」のボタン押す。

という3段階があります。

2番目の操作手順にある、検索するファイルの指定ですが、NICE はすべて、XXX.txt の形式で保存されていますので、ファイルの欄には、「*.txt」と入力してください(「*」は、どんな文字でもよいことを示す、「正規表現」と呼ばれるものですが、正規表現については、今後説明します。)。

また、検索するフォルダについては、NICE の入っているフォルダを選択してください。なお、動画では、NNS のデータが入っているフォルダのみを検索対象にしています。

動画では、「I think that」という表現を検索しています。「検索」ボタンを押して数秒も経たないうちに、「I think that」を含んだデータが、検索結果として表示されているはずです。

今回は、基本的な検索方法を紹介しました。次回以降は、発展的な検索手法を紹介します。


▼お知らせ
現在、学習者コーパス「NICE」のベータ版配布を行っています。無償で利用可能ですが、お申し込みが必要です。詳しくは、こちらのサイトをご覧ください。なお、9月頃10月頃を目処に、正式版の公開を予定しています。


■筆者プロフィール
阪上辰也(さかうえ・たつや)
名古屋大学大学院 国際開発研究科 特任助教。
専門は、コンピュータを利用した外国語教育。
ウェブサイトは、sakauetatsuya.net

2008年 8月 26日