NTTデータベースシリーズ 日本語の語彙特性 第2期

定価
22,000円
(本体 20,000円+税10%)
判型
B5判
ページ数
12ページ
付属品
CD-ROM4枚 付属検索ソフト:EGサーチ
ISBN
978-4-385-61136-5
  • 改訂履歴
    2000年3月31日
    書籍+CD-ROM版刊行
    2003年5月1日
    CD-ROM版刊行
    2008年9月8日
    CD-ROM版増刷

言語に関わるあらゆる研究領域において、重要かつ不可欠なデータベース!

CD-ROM4枚+解説小冊子12頁

NTTコミュニケーション科学基礎研究所 監修/天野成昭、近藤公久 編著

  • NTTコミュニケーション科学基礎研究所が取り組んできた、人間の言語機能の解明を目指した研究。「日本語の語彙特性」は、この研究を合理的かつ能率的に進めることを目的に構築した、大規模かつ高信頼度のデータベースです。単語親密度、単語表記の妥当性、単語アクセントの妥当性、単語心像性、漢字親密度、漢字複雑度、漢字の読みの妥当性など、人が主観的に評定を行ったデータと、14年間という長期にわたる新聞に単語や文字が出現した回数を数えた客観的データを収録した、言語に関わるあらゆる研究領域において、たいへん重要かつ不可欠なデータベースといえます。
  • 【第2期】朝日新聞の1985年から1998年の14年分の記事データに対し、形態素解析を行って単語を切り分け、抽出した36万語の出現頻度と、そこに含まれる文字の出現頻度を調査したデータベース。多様な条件で検索できる検索ソフトを搭載している。
  • 未定義語リストと活用語頻度データベースも含め、全データベースを電子データとして収めた。データベースの解説はPDFファイル形式で収録。

特長