今年6月25日、突然他界してしまったマイケル・ジャクソン。その衝撃が世界を駆け巡ったことは記憶に新しいところですが、Twitter 上でも追悼メッセージが多数書き込まれました。そんな追悼メッセージを分析し、テキストからどのように「感情」を読み取るかという研究結果が発表されています:
■ Detecting Sadness in 140 Characters (Web Ecology Project)
有名人の死去(真実とガセネタの両方)に関する Twitter 上のメッセージ、約233万件(うち約186万件がマイケル・ジャクソンに関するもの)を集め、傾向を分析したもの。データ抽出には Twitter のAPIを使い、"MJ"や"Michael Jackson"などといった単語が含まれるメッセージを抜き出したそうです。従って集められたデータの中には、英語以外の言語で書かれたメッセージも僅かながら含まれていたとのこと。
なぜこのような分析が行われたのか――実は"ANEW"(Affective Norms for English Words)というデータセットがあり、1,034の英単語について、それがどんな感情を有しているか数値化されているのだとか。で、それを使ってどこまで機械的に「ある文章が有している感情」を把握できるかがこの研究の目的の1つらしく、ANEWによる分析を行う一方で346件のメッセージをランダムに抽出、人間による分析/比較が行われたそうです。ちなみに Twitter 以外のオンラインテキストについては、ANEWを使った分析の例が既に存在しているとのこと。
以下のグラフは、マイケル・ジャクソンの死去について語ったメッセージがどのように現れたかを時系列で示したもの。当然ですが、第一報が伝わった米国時間の6月25日夜がピークとなっています:
それでは分析の結果、どのような発見があったのかというと:
- At its peak, the conversation about Michael Jackson’s death on Twitter proceeded at a rate of 78 tweets
per second.
(ピーク時、マイケル・ジャクソンの死に関する Twitter 上のメッセージは、1秒間に78件というペースに達した) - Users tweeting about Jackson’s death tend to use far more words associated with negative emotions than are found in ‘everyday’ tweets.
(マイケル・ジャクソンの死について語るメッセージは、通常の否定的感情を語るメッセージよりも長くなる傾向があった) - Roughly 3/4 of tweets about Jackson’s death that use the word “sad” actually express sadness, suggesting that sentiment analysis based on word usage is fairly accurate.
("sad"という単語を使ってマイケル・ジャクソンの死を語っていたメッセージのうち、およそ4分の3が実際に悲しみを表していた。つまり語法を基にした感情分析が非常に正確だということになる) - That said, there is extensive disagreement between human coders about the emotional content of tweets, even for emotions that we might expect would be clear (like sadness).
(一方で、あるメッセージの感情をどう解釈するかについて、解釈を行った人物の間で意見の対立があった。それが悲しみのように、明らかな形で示されると想定される感情の場合でも。) - Tweets expressing personal, emotional sadness about the Jackson’s death showed strong agreement among coders while commentary on the auxiliary social effects of Jackson’s death showed strong disagreement.
(マイケル・ジャクソンの死に対する、個人的で、感情的な悲しみを示したメッセージについては、人間による分析が一致する傾向が高かったが、マイケル・ジャクソンの死が社会にもたらす影響について語ったコメントに関しては、分析者の間で見解が分かれた。) - We argue that this pattern in the “understandability” of certain types of communication across Twitter is due to the way the platform structures the expression of its users.
(このような「分かりやすさ」のパターンが現れる原因は、Twitter というプラットフォームがユーザーに課している表現の構造にあると私たちは考える。)
とのこと。うーん、正直一読しただけでは半分も理解できなかった論文なので、これから改めて読んでみたいと思います。
ただ少なくとも、1秒間に78件というペースで追悼メッセージが書き込まれたこと、通常の悲しみの場合よりもメッセージが長くなったことは、それだけ人々がマイケル・ジャクソンを慕っていたことの表れだと思います。改めて、彼の冥福を祈ります。
コメント