国際日本文化研究センター、古事類苑全文データベースを公開(2008-05-26)

screenshot

国際日本文化研究センターが古事類苑全文データベースを公開した(2008-05-26)。

・古事類苑全文データベース
http://ys.nichibun.ac.jp/kojiruien/
http://www.nichibun.ac.jp/graphicversion/dbase/kojiruien-zenbun.html
国際日本文化研究センター
http://www.nichibun.ac.jp/

「古事類苑」は1896年(明治29年)から1914年(大正3年)にかけて編纂された百科事典。制度、文物、社会全般の事項を30部門に分け、1867年(慶應3年)までの文献が多く引用されているという特徴がある。

総ページ数が約6万7000ページ、見出し数は約4万項目に及ぶこの大事典の電子化には、長らく国際日本文化研究センター山田奨治さんと国文学研究資料館相田満さんらが取り組んできており、その成果の一端が今回公開された古事類苑全文データベースである。

山田奨治研究室
http://www.nichibun.ac.jp/~shoji/
山田奨治研究室 - 電子化古事類苑プロジェクト
http://www.nichibun.ac.jp/~shoji/cgi-bin/dmh/wiki.cgi?page=%C5%C5%BB%D2%B2%BD%B8%C5%BB%F6%CE%E0%B1%F1%A5%D7%A5%ED%A5%B8%A5%A7%A5%AF%A5%C8

なお、今回公開されたのは全30部門からなる「古事類苑」のうち、

  1. 天部
  2. 歳時部
  3. 地部

の3部。地部については一部の公開となっているが、それでもこれだけの電子テキストが作成され、かつ検索できるようになったことは画期的というほかない。現時点では約3200ページ分の全文テキストデータを公開しているというが、残る6万3800ページが電子化されると、日本語の電子テキストの世界はどう変わっていくだろうか。この先の未来に大きな期待を抱きつつ、まずはこれまで事業を進めてきた山田奨治さん、相田満さん、早川聞多さんらに感謝したい。

なお、「古事類苑」の電子化については、山田奨治さんらによる研究報告が出されている。

山田奨治早川聞多相田満「古事類苑(天部・地部)の全文入力とWiki版の試行−前近代の文化概念の情報資源化」(「情報処理学会研究報告人文科学とコンピュータ研究会報告」112、情報処理学会、2006年)
http://ci.nii.ac.jp/naid/110004837757/
・「東京大学史料編纂所、古事類苑−総目録・索引を公開(2007-07-02)」(新着・新発見リソース、2007-08-12
http://d.hatena.ne.jp/arg/20070812/1186850916