2012年1月7日土曜日

Twitter + イベント検出

Extracting Events and Event Descriptions from Twitter
http://www.www2011india.com/proceeding/companion/p105.pdf

This paper describes methods for automatically detecting events
involving known entities from Twitter and understanding both the
events as well as the audience reaction to them. We show that NLP
techniques can be used to extract events, their main actors and the
audience reactions with encouraging results.


Earthquake Shakes Twitter Users:Real-time Event Detection by Social Sensors
http://ymatsuo.com/papers/www2010.pdf


Streaming First Story Detection with application to Twitter
http://aclweb.org/anthology/N/N10/N10-1021.pdf

With the recent rise in popularity and size of
social media, there is a growing need for systems that can extract useful information from
this amount of data. We address the problem of detecting new events from a stream of
Twitter posts. To make event detection feasible on web-scale corpora, we present an algorithm based on locality-sensitive hashing which is able overcome the limitations of traditional
approaches, while maintaining competitive results. In particular, a comparison with a stateof-the-art system on the first story detection
task shows that we achieve over an order of
magnitude speedup in processing time, while
retaining comparable performance. Event detection experiments on a collection of 160 million Twitter posts show that celebrity deaths
are the fastest spreading news on Twitter.


Detecting Controversial Events from Twitter
http://www.marcopennacchiotti.com/pro/publications/CIKM_2010.pdf
Social media provides researchers with continuously updated
information about developments of interest to large audi-
ences. This paper addresses the task of identifying contro-
versial events using Twitter as a starting point: we propose
3 models for this task and report encouraging initial results.


以下、http://hashimomau.chips.jp/weblogs/?page_id=182より抜粋

題名:Why We Twitter: Understanding Microblogging Usage and Communities
出典:Joint 9th WEBKDD and 1st SNA-KDD Workshop ’07
概要・特徴:
twitterを分析した論文(初期なのでは??)
twitterユーザの世界分布、ユーザ数の増加など
twitterユーザの行動分析
ユーザは情報収集、日常の他愛もないつぶやき、他のユーザとのコミュニケーションをしている
HITSアルゴリズムを用いてコミュニティ分析もしている
感想:この論文は引用されることが多く、twitterを研究される方は取りあえず、読んでおくと良いです!
リンク:http://ebiquity.umbc.edu/paper/html/id/367/Why-We-Twitter-Understanding-Microblogging-Usage-and-Communities
題名:TwitterRank:Finding Topic-sensitive Influential Twitterers
出典:WSDM 2010
概要・特徴:
Twitter内の有力なユーザを抽出する方法を提案
TwitterRank:ページランクのアルゴリズムを拡張して実現。実験の結果より、他のアルゴリズムと比較して良い評価を得た
Twitterユーザに“homophily”が存在することを示し、“フォロー”関係に趣向(話題)の類似性があることを証明した
感想:フォロー関係に話題の類似性があることを学術的?統計的に示した論文。技術系論文では初らしい。PageRankを用いているため、有力ユーザ(有名ユーザ)の検出には効果がありそう。しかし、どの辺がTopic-sensitiveなのか分からなかったです。
リンク:http://www.mysmu.edu/staff/jsweng/papers/TwitterRank_WSDM.pdf


題名:Predicting Elections with Twitter: What 140 Characters Reveal about Political Sentiment
出典:Proceedings of the Fourth International AAAI Conference on Weblogs and Social Media 2010
概要・特徴:
twitter×選挙(政治)の関係を示した論文
twitterの投稿数とドイツ議会選挙との関係を調査した論文(投稿数から選挙結果を予想している)
LIWC(投稿の感情を分析するツール)を用いてセンチメント分析し、当時の政治状況と考察している
感想:投稿数から選挙結果を導けるかどうか疑問。しかし、選挙とtwitterの投稿を自然言語処理を用いて導いていると論文は初?投稿(ドイツ語)→英語に変換→LIWC(投稿の感情を分析するツール)を用いている。これはドイツ語と英語の互換性が高いから出来る事。日本語じゃ無理ぽ。 ※日本だとWEBと政治の関係を示した論文が極端に少ない気がします。
リンク: http://videolectures.net/icwsm2010_sprenger_pet/
題名:Tweet the Debates Understanding Community Annotation of Uncollected Sources
出典:WSM’09
概要・特徴:
アメリカ大統領選挙中の党首討論の議論の流れと、同時期のtwitterの議論の流れを解析した研究
twitterの投稿から動画のアノテーションを試みる研究
党首討論はTV放送で中継されており、中継中の字幕放送を議論の流れとしている
twitterの投稿は、ハッシュタグを使用しているtweetなどを利用している
感想:投稿からアノテーションをする研究は興味深かったです。
リンク: http://videolectures.net/icwsm2010_sprenger_pet/
題名:Microblogging During Two Natural Hazards Events: What Twitter May Contribute to Situational Awareness
出典:CHI 2010: Crisis Informatics
概要・特徴:
マイクロブログの性質を利用して災害時における情報伝播のメカニズム?を調べた研究
実際の災害時におけるデータを使用している
the Oklahoma Grassfires of April 2009 and the Red River Floods that occurred in March and April 2009
感想:災害時にマイクロブログのリアルタイム性の高さが役つということが分かった論文。具体的な手法は覚えてないが、そのような結論だったはず。マイクロブログの特徴が社会に役に立つと思った論文でした。
リンク: http://delivery.acm.org/10.1145/1760000/1753486/p1079-vieweg.pdf?key1=1753486&key2=5717842921&coll=DL&dl=ACM&CFID=2537635&CFTOKEN=65603928
題名:Twitter mood predicts the stock market.
出典:今後どこかに投稿するらしい 2010現在
概要・特徴:
Twitterの投稿からNYダウ平均株価(DJIA)のアップダウンを87.6%の精度で予測
解析対象
We only take into account tweets that contain explicit statements of their author’s mood states.
“I feel”, “i am feeling”, “i’m feeling”, “i don’t feel”, “I’m”, “Im”, “I am”, and “makes me”.
上記解析対象をP/N(肯定/否定)判定器のOpinionFinder(OF)とセンチメント分析器のGoogle-Profile of Mood States(GPOMS)両者の差分値を示した
GPOMSは投稿を Calm, Alert, Sure, Vital, Kind, Happy に分類できる
また、両解析結果を2つの市場予想モデル?に適応している
Bivariate Granger Causality Analysis 、Self-organizing Fuzzy Neural Network (SOFNN) モデル
SOFNNモデルCalmに着目することで、 87.6%の精度を実現した

0 件のコメント:

コメントを投稿