国立国語研究所、代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備(日本語コーパス)を公開(2006-09-01)

国立国語研究所が代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備(日本語コーパス)を公開した(2006-09-01)。科学研究費補助金の特定領域研究として行われるこの事業は2006年度から2010年度までの5年間を目途としており、

  1. 現代日本語のコーパス言語学的研究の基盤を整備するために、大規模な現代日本語書き言葉コーパスを構築すること
  2. 構築途上のコーパスを様々な領域で利用することによってコーパス日本語学の可能性を探り、同時に構築中のコーパスを評価すること

「本領域のめざすもの」
http://www.tokuteicorpus.jp/outline/index.html#01

を目標としている。かつてない大規模なプロジェクトであり、実に様々な分野の研究者が集っている。
科学研究費(科研費)関係のサイトは往々にして見栄えだけが光るところが多いが、本プロジェクトのサイトは複数ある研究班からの最新情報をCMSソフト「Nucleus」を使って管理したり(「各研究班からのお知らせ−最新投稿リスト」を参照)、背景に使われている画像がコーパスをイメージしたものであったりと、細部まで手が込んでいる。サイトの活用方法を含め、どのような研究成果が発信されてくるのか、大いに気になるところだ。

・代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備(日本語コーパス
http://www.tokuteicorpus.jp/
Nucleus CMS Japan
http://japan.nucleuscms.org/
国立国語研究所
http://www.kokken.go.jp/