産業技術総合研究所、日本語のポッドキャストを検索対象とするPodCastleを公開(2008-06-12)

screenshot

産業技術総合研究所の情報技術研究部門が日本語のポッドキャストを検索対象とするPodCastleを公開した(2008-06-12)。

PodCastle
http://www.podcastle.jp/
Podcastle Wiki
http://wiki.podcastle.jp/
・「ユーザーが協力すると性能が向上する音声情報検索システムを実現−インターネット上の音声情報を認識・検索するサービスを開始」(産業技術総合研究所2008-06-12
http://www.aist.go.jp/aist_j/press_release/pr2008/pr20080612/pr20080612.html
産業技術総合研究所 情報技術研究部門
http://itri.aist-go.jp/
後藤真孝's Home Page
http://staff.aist.go.jp/m.goto/index-j.html
・Jun Ogata's Home Page
http://staff.aist.go.jp/jun.ogata/
産業技術総合研究所
http://www.aist.go.jp/

開発したのは同部門研究員の後藤真孝さん、緒方淳さんらの研究グループ。このシステムはすでに2006年12月から研究者向けにベータ版として試験公開されてきたが、今回一般向けに公開された。

PodCastleは第一印象ではポッドキャストを検索対象とした検索エンジンだが、プレスリリースにあるように「ユーザーが協力すると性能が向上する」ところに醍醐味がある。検索対象になっているポッドキャストは、元来は音声データであり、一般的な検索エンジンのように本文中の言葉を対象に検索することはできない。だが、PodCastleでは、ポッドキャストを検索対象とする際に、音声認識技術によって音声データから文字データを機械的に書き起こし、実際のその言葉が話されているポッドキャストの検索を実現している。しかし、自動的な音声認識技術には限界もあり、当然誤った内容の文字データもつくられてしまう。そういった不可避な誤りについては、誤りに気づいた利用者が訂正できるようになっており、「ユーザーが協力すればするほど音声の検索・認識の性能が向上する」仕組みを実現している。