松村真宏さん、テキストマイニング用ソフトウェア「TTM: TinyTextMining」を公開(2007-09-14)

screenshot

松村真宏さんがテキストマイニング用ソフトウェア「TTM: TinyTextMining」を公開した(2007-09-14)。csv形式で保存されたタグ付きテキストデータを読み込んで、

  1. 語のタグ別出現度数(単語頻度)
  2. 語のタグ別出現度数(文書頻度)
  3. 語×タグのクロス集計(単語頻度)
  4. 語×タグのクロス集計(文書頻度)
  5. 語×語のクロス集計(文書頻度)
  6. テキスト×語のクロス集計(単語頻度)

を抽出できるWindows用ソフトウェアという。テキストマイニングに基づく分析や研究を行う上でのデータの前処理を非常に効率的にしてくれるだろう。「TTM: TinyTextMining」はフリーソフトウェアとして公開されており、誰でも自由に自己責任で使うことができる。また、インストール方法や利用方法について三浦麻子さんがまとめた資料もあわせて公開されている。すでに先行して公開されていたが、2007年9月22日(土)から24日(日)にかけて早稲田大学で開催された日本社会心理学会第48回大会のワークショップ「テキストマイニングによる内容分析の現状と課題」で正式にお披露目された。

研究者がソフトウェアを無償公開することは決して珍しくはないものの、この「TTM: TinyTextMining」は使い方もかなりやさしく、かつ機能的に非常に優れている。開発者である松村真宏さんに感謝したい。「TTM: TinyTextMining」を利用する方々には、ぜひ利用に際して気づいた不具合やさらなる発展性を松村さんにフィードバックするように心がけてほしい。数年のうちに「TTM: TinyTextMining」を利用した旨を謝辞に記した論文が様々な分野で活発に発表されるようになることを期待したい。

・TTM: TinyTextMining
http://fieldmining.com/~matumura/ttm/
・TTM: 初心者のためのインストールガイド
http://fieldmining.com/~matumura/ttm/installation/install_guide.html
・TTM: 発展的な分析のためのメモ
http://fieldmining.com/~matumura/ttm/adv_analysis/advanced_analysis.html
・松村研究室(松村真宏さん)
http://fieldmining.com/~matumura/
・Asako Miura, Ph. D. (Social Psychologist)(三浦麻子さん)
http://www.team1mile.com/asarin/
・日本社会心理学会第48回大会
http://db1.wdc-jp.com/jssp/conf/jssp2007/