国立国会図書館、「日本のWebサイトの網羅的収集、蓄積及び保存に関する調査報告概要」を公開

国立国会図書館が「日本のWebサイトの網羅的収集、蓄積及び保存に関する調査報告概要」を公開した(2006-03-01)。この調査は、The Internet Archieveに代表される、いわゆるウェブアーカイブの可能性を調査・研究するために、2004年10月から2005年3月にかけて行なわれたもので、株式会社NTTデータが受託して行なった。調査の結果、2005年3月の時点では、日本の「Webデータ総量は18.4TB、ファイル総数は4億5000万ファイルであると推定された」という。このデータ量が注目されそうだが、この調査結果に基づき、ウェブアーカイブの要件について、「収集」「蓄積・保存」「閲覧」の3つの観点から、国立国会図書館の見解がまとめられていることも重要なポイントの一つだろう。

・日本のWebサイトの網羅的収集、蓄積及び保存に関する調査報告概要
http://www.ndl.go.jp/jp/aboutus/bulkresearch2005index.html
国立国会図書館
http://www.ndl.go.jp/
・The Internet Archieve
http://www.archive.org/