2009年12月27日日曜日

バースト検知のアルゴリズム

松浦君の「ストリーム処理とバッチ処理の動的負荷分散」の研究に関連するが、バーストの検知アルゴリズムに関する研究が様々な分野において行われているが、もっとも有名なアルゴリズムが コーネル大学のJon Kleinberg (ホームページ)が2002 年に提唱したアルゴリズム。このアルゴリズムの強力さは、特にテキスト処理に限らない汎用性があること。

J. Kleinberg. Bursty and Hierarchical Structure in Streams. Proc. 8th ACM SIGKDD Intl. Conf. on Knowledge Discovery and Data Mining, 2002.

東工大の奥村先生のグループがこの Kleinberg をテキスト処理に応用した論文を出されているようなので参考にしましょう。

  • 「周期的に発生する burst の予測と抑制」藤木稔明、奥村学(PDF), 2004
  • 「document streamにおけるburst の発見」藤木稔明、奥村学, 2004
  • ブログ上での話題伝播に注目した重要語抽出、松尾さんなど, 2007
  • コールセンターのログデータを用いた製品等の不具合の早期発見,

0 件のコメント:

コメントを投稿