まちゅダイアリー
2007-01-09 (火)
■ 今日は Wiki 小話の日
年末年始を挟んですっかり忘れそうになっていたけど、今日は Wiki 小話の日。
忘れずに行ってきた
感想を書くまでが Wiki ばなということで…。
今回は、 Podcast の検索サービス Podcastle についての話だった。
- 音声認識研究のキラーアプリ
- 世界初の日本語音声検索
- 育てる音声認識エンジン(音声認識の誤りを利用者が修正 → 音声認識エンジンがより賢く)
という話だった。 不完全なもの(音声認識とは不完全なものなんだそうな)を、多くの人が少しずつ手を加えて使えるものにしていくというアプローチが、まさに Wiki 的。 ネタの選定もいいし、サーバ側もクライアント側もよく作りこまれていて、これは将来が楽しみ。 Podcast 自体にはそれほど興味が無かったんだけど、 Podcastle が普及したら Podcast も広まるかも…と思った。
特に印象に残ったところだけを箇条書きにする。
- 開発は qwikweb + skype を使った。開発者全員が一同に集まったのは今日が初めて(!)
- 1年前のWikiPedia の音声版が欲しいという雑談から Podcastle のアイデアが生まれた
- 音声認識は普及していない。カタログに記載されている95%の認識精度では、まだまだ不十分。 ← 正確にはカタログの表記がある条件下でのベスト値だから実際には使えないという話というツッコミあり。
- 研究分野の音声認識は精度重視。商用分野では速度重視。
- 音声認識のために単語を N-gram でモデル化。単語は過去の新聞記事から登録。
- 最新の言葉は Web ニュースから学習する。芸能ネタに強い音声認識エンジンは珍しい。
- 検索サーバは Rails で作成。REST 的なアーキテクチャーで API を構築。
- id:brazil さんの超絶プレゼンテクニック。犬の鳴き声。
- jsh (JavaScript shell?) とか External Interface とか FlashProxy とか。
- 集合知を活かした新しい検索の形。利用者に参加してもらうためには、「自分が嬉しい」が大切。お金じゃ動かない。
スタッフ・発表者の皆様へ謝辞
今回、参加者の名前入りのネームプレートが入り口で配られていたのですが、あれ、すごく良かったです。 おかげで懇親会の場で、 uemura さん、 kitaj さんとご挨拶することができました。
勝手に、「これ、参加費無料で大丈夫?」と心配しちゃいました。 ともあれ、素敵な場をありがとうございます。 月イチ開催なるか…?
■ 今日は Wiki 小話の日 (2007-01-11の追記)
公式ページのコメント欄に、感想のリンクが続々追加されてる。 (ホントは参加者欄に各自がリンクを貼るほうがWiki的かもだけどね)
blog.8-p.info : Podcastle Nightが良くまとまっている。
Wiki小話/Vol.7「Podcastle開発について」とすごすぎるブラジルさんのプレゼンについて:[mi]みたいもん!にて、超絶プレゼンの動画が公開されてる(ご本人の了解は取られてるのかな?→取られているとのことでした)。 改めて見ても、うまいなーって思う。 というか、みたいもんの人に挨拶しておけばよかったと後悔…。
ネームプレートは小話Vol.4から作り始めたとのこと。 そういえばVol.4と6は欠席しているんだった。 「Wikiのセキュリティアップ考〜認証、権限、スパム対策〜」の話は、いつかやってみたい(夢)ですね。 ただ今は、認証、権限と Wiki を結びつけるネタが無いのが残念なところ…。
代わりといってはなんだけど、 Wiki について最近思うところを。 前回書いたのは、Wikiばな Vol.5に参加したときか。
記法とか使い勝手とか、 Wiki について色々考えてた気がするけど、結局は Wiki って集合知ツールなんだろうと(今更何をって感じだけど、でもそう思う)。 ここからは完全に個人的な意見だけど、集合知がうまく働くのは、60%のモノを80%に押し上げる時だと思ってる。 60とか80とかの数値は感覚的だけど。 白紙の Wiki には誰も書き込んでくれない。反対に 100% 完成されている Wiki にも書き込みづらい空気がある。 でも、60%の完成度だったら…「惜しいから直したくなっちゃう」気持ちが働くんじゃないかな。 (いわゆるサクラと同じ?)
Podcastle は、そういった意味でとても Wiki 的だと感じた。 しかも、従来の Wiki と違うのは、 60% のモノを作るのが人間じゃなくて機械ということ。 従来の Wiki は、誰か(主に管理人)が最初にコンテンツを作り、0%から60%の状態に持っていっていた。 Podcastle は、60%(実際はもっと数値高そうだけど)の音声認識エンジンが予めあって、それを参加者が 80% に仕上げている。
さらに妄想が進むけど、今後は「60% の何か」と「20% の集合知」のパターンが増えるんじゃないかって気がしてる。 プログラムで何かを作ろうとした場合に、これまでなら完全なもの…最低でも80%のものを作らないといけないと考えてた。 でも、精度が60%のものであっても、残りの20%を利用者がちょっとずつカバーしてくれるとしたら。 これまではプログラミングは難しいとされていた分野でも、実は可能性が広がるんじゃないかな。
と、ここまで書いたところで、「それって何てオープンソース?」ということに気がついた。 Wiki はデータ(情報)のバザールモデル?
…そろそろ原典 (WikiWay) を読んだ方がいい気がしてきた。
昨日はどうもでした。<br>あまりお話できず残念でした。また何かのイベントでお会いした時はよろしくです。
ちょっとだけでしたが、ご挨拶できて良かったです。<br>また楽しい夢を聞かせてください!
> カタログに記載されている95%の認識精度では、まだまだ不十分。<br><br>95%が本当にできればそれはほぼ十分使えるすごいことだと思いますよ!<br>Wikibanaでの説明は95%が不十分ではなく,カタログの表記がある条件下でのベスト値だから実際には使えないという話だと思いますよ.<br><br>条件下とは,ある程度発言分野が想定できる範囲(例えば新聞用語)で,話者学習が進み,話者も音声認識用にはきはきしゃべる.
ツッコミありがとうございます。<br>ちょっと誤解していたみたいでした。