最近、様々なスピーチをタグクラウド化するというのが流行っていましたが(参考:タグクラウドの意外な使い方、Microsoft の進化が分かるタグクラウド)、以下のツールもそんな「言葉を可視化する」手法の1つでしょう。New York Times に、ブッシュ米大統領が就任から現在まで(2001年~2007年)に行った就任演説と一般教書演説(State of Union Address)を分析できるツールというものが掲載されていました:
■ The 2007 State of Union Address (New York Times)
アクセスすると、以下のような画面が表示されます:
画面左上からキーワードを入力できるようになっていて、何らかの単語を入れて実行すると、結果がその下に表示されます。左側にある列は、一本一本が毎年の演説を示していて、その年に検索キーワードが使われていれば赤いドットで示されます。デフォルト画面は"Iraq"という言葉で実行した結果が表示されているのですが、これを見ると、2003年から出現頻度が激増しているのが分かりますね(ちなみに列の上下は時間の前後を示していて、上にあればあるほど先に言及されたことになります)。
画面右側にあるのが、出現回数を数値と円で表したもの。当然ですが、円が大きければ大きいほど出現回数が多いことを示します。さらに他のキーワードとも比較できるようになっていて、例えば"Afghanistan (アフガニスタン)"というキーワードは"Iraq"に反比例して出現頻度が低くなっていることが分かります。
また上のスクリーンショットでは切れてしまっているのですが、画面最下部には実際のスピーチのテキストが表示されます(キーワード該当部分の前後のみ)。テキストを表示させるには、各スピーチ上の赤いドットをクリックすればOK。「前/後」でジャンプすることも可能です。単に出現回数/頻度/散布状況だけでなく、文脈も確認することができるわけですね。
ちなみに以下は、"Japan"というキーワードで検索した結果です。うーん、某首相が嬉々としてお付き合いしていた割には、ブッシュ大統領はあんまり語ってくれなかったようで……:
このツールの良いところは、文字通り「一目で」あるキーワード(≒トピック)がいつ話題になったか/どの程度重視されたか/他のトピックと比較するとどうなるか、が把握できるところ。実際のスピーチを聞くだけでは見えてこない全体像を明らかにするツール、と言えるでしょう。タグクラウド同様、日本の首相のスピーチや、大企業トップのスピーチに当てはめてみても面白い分析ができそうですね。
コメント