名古屋大学佐藤研究室、日本語テキストの難易度を推定する「帯 1.x(obi-one)」を公開(2008-04-30)

screenshot


名古屋大学大学院工学研究科電子情報システム専攻の佐藤理史研究室が日本語テキストの難易度を推定する「帯 1.x(obi-one)」を公開した(2008-04-30)。

・帯 1.x(obi-one)
http://kotoba.nuee.nagoya-u.ac.jp/sc/readability/
・ことば不思議箱
http://kotoba.nuee.nagoya-u.ac.jp/
・佐藤研究室 / Sato Lab.
http://sslab.nuee.nagoya-u.ac.jp/
・佐藤理史さん
http://sslab.nuee.nagoya-u.ac.jp/~sato/

これは入力された日本語の難易度を学校段階を基準に判定するもので、

  • 1〜6:小学(1年〜6年)
  • 7〜9:中学(1年〜3年)
  • 10〜12:高校(1年〜3年)
  • 13:大学

の13段階で判定結果を示してくれる。なお、判定の材料となる基礎データとして小学校から大学にかけての教科書127冊から抽出した教科書コーパス(1478サンプル、約100万字)を用いている。

たとえば、上記の文章の場合、「難易度=13(大学・一般)」という判定結果になる。

なお、佐藤研究室では「ことば不思議箱」と題して、他にも

screenshot
screenshot

・基本慣用句五種対照表
http://kotoba.nuee.nagoya-u.ac.jp/jc2/kanyo/
・日本語基本語彙表JC2
http://kotoba.nuee.nagoya-u.ac.jp/jc2/base/

を公開している。