2010-03-01(Mon): 「『図書館』の未来を探る勉強会−マイニング探検会(マイタン)を始めます」
2010年4月から、清田陽司(東京大学情報基盤センター)と岡本真(アカデミック・リソース・ガイド)の両名を発起人に、『図書館』の未来を探る勉強会「マイニング探検会」(マイタン)を始めます。比較的少人数での開始を考えており、本日から参加希望の申込受付を開始します。
そこで、まずは、なぜいまマイニング探検会を始めるのか、我々の趣意を記しておきます。
*
私たちが日々の生活で享受している便利なWebサービスの裏側には、いったいどのような仕掛けが動いているのでしょうか? サーチエンジンに思いついたキーワードを入力すると、世界中のWebページの検索結果が一瞬で得られます。オンライン書店で本を買うと、あまりにも的確なお薦めが来て驚かされることがあります。
このようなWebサービスは、膨大なデータから必要な情報を効率的にマイニングする技術の数々によって支えられています。これらの要素技術をサービス開発者の視点から理解していくと、「こんなサービスが実現できるかもしれない」といったアイディアが次々に浮かんできます。まさに世界を相手にした知的ゲームです。こんな面白いゲームをWeb業界の人々だけに独占させておくのはあまりにもったいない!
このゲームを支えている知識を身につけて、プレーヤーとして参加してみませんか? 「マイニング技術探検会」、略して「マイタン」は、参加者ひとりひとりが新たな情報サービスのプロデューサーとして活躍されることを目指し、情報マイニング技術の広大なフィールドを皆さんと一緒に探検していきます。図書館業界、出版業界といった枠を一歩飛び出して、新たなアイディアを熱く語り合い、お互いに刺激を与え合っていきましょう!
新たな情報サービスを創り出すというゲームに参加するには、どんなテクニック(要素技術)が使えるのかを知っておくことはもちろん大事です。しかしながら、個々の要素技術がどのような背景で登場してきたのか、社会にどのようなインパクトを与えているのか、利用者はいったい何を期待しているのかという「マクロな視点」を身につけることで、ゲームはさらに面白くなっていきます。マイタンでは、情報マイニング技術をひとつひとつ理解していく過程で、次のようなトピックについても皆さんとともに考えていきます。
【マイニング技術の背景】
- 膨大なデータのマイニングを可能にしたコンピューター技術の発展を支えているものは何か? 今後のコンピューター技術はどう発展していくのか?
- データ量が生み出す価値とは? 膨大なデータを相手にすることで初めて見えてくるものは何か?
- 専門家によって生み出される専門知(紙の百科事典、目録など)と、多数の参加者によって生み出される集合知(Wikipedia、フォークソノミーなど)の違いは? 集合知から有用な情報を発見する技術の現状は? 両者の知識を融合していくにはどうすればよいか?
【社会とのかかわり】
- 情報環境が激変していく中で、図書館の掲げるミッションを引き続き遂行していくには、どのような情報サービスが必要とされるか?
- 電子書籍プラットフォームの普及はどんな影響を与えるのか?
- 利用者の履歴データを活用することは、利用者のプライバシーにどんな影響を与えるのか? 悪影響を克服するためにはどんな技術が使えるのか?
- 魅力あるWebサービスを提供するには、システムベンダーやコンテンツプロバイダーなど、外部のプレーヤーとの協力が欠かせない。これからの情報環境に適応するには、どのような形で協力していけばいいのか?
- オープンソースソフトウェアをWebサービスに活用する上での課題は?
【サービス利用者とのかかわり】
- Webサービスの爆発的な普及は、図書館や出版社に対する利用者のニーズにどんな影響を与えているのか?
- 図書館や出版社がもつコンテンツの魅力をさらに引き出していくにはどうしたらよいか?
- Webサービスの利用者がすでにもっているさまざまなノウハウをうまく活用してもらえるWebサービスを提供するには、どんなポイントを押さえておけばよいのか?
マイタンでは、狭義のマイニング技術(データマイニング、テキストマイニング)だけでなく、マイニングを「利用者と膨大なデータを結びつけること」と広くとらえ、Webサービスをプロデュースするのに必要となるさまざまな要素技術についても押さえていきます。以下のような要素技術を、参加者の皆さんの要望を踏まえて扱っていく予定です。
- サービス間連携を実現するAPI: Amazon、CiNii、PORTA、J-Globalなど
- 検索技術: Google、Yahoo!、GETAssoc、TSUBAKIなど
- レコメンド技術: 協調フィルタリング、プロファイル推定など
- テキスト処理技術: 形態素解析、構文解析、固有表現抽出、クラスタリングなど
- Webインタフェースを支える技術: Ajax、Flash、HTML5など
- 大規模システムを構築するための技術: Hadoop、Amazon EC2、Amazon S3、Google App Engine、Windows Azureなど
- コンピューターシステムの信頼性を高める技術: HDFS、ZooKeeperなど
*
第1回は2010年4月9日(金)の19時から21時までで開催予定です。
以上の趣旨にご賛同いただけ、ご参加いただける方は、
より参加申込をお願いします。申込の〆切は3月12日(金)です。なお、参加者全員で創り上げていく勉強会を目指す関係上、当初は参加者数を限定します。基本的には【20名】、多くても【30名】程度で開始します。申込者多数の場合は、当方にて選考させていただくことがあります。この点、あらかじめご了承ください。また、参加者には基本的にノートパソコンの持参をお願いすることになります。この点もあらかじめご了承・ご準備ください。
- 主催:アカデミック・リソース・ガイド株式会社
- 協力:株式会社リッテル、東京大学情報基盤センター学術情報研究部門、同 中川研究室
- 対象:ライブラリアン。自治体の情報政策・システム担当者。図書館情報学専攻の学生・院生。図書館システムベンダーの社員。出版関係者など。
- 会場:東京大学 本郷キャンパス
- 期間:2010年4月〜2011年3月(試験的に1年間継続し、以降は要望を踏まえて検討)
- 予定:
- 2010年3月1日(月):第一次参加申込の開始
- 2010年3月12日(金):第一次参加募集の〆切、参加者の確定
- 2010年3月15日(月):申込者への通知、メーリングリスト開設
- 2010年4月9日(金):第1回開催、第2回以降の日程・内容確定