「ネットでの情報発信は実名であるべきだ」「いや匿名だからこそ言えることがある」という議論には終わりが見えませんが、その善し悪しを問わず、ネット上で匿名でいられるのは技術的に難しくなっているようです。といってもIPアドレスから個人を特定するという話ではなく、書かれた文章の「クセ」から判別する手法とのこと:
■ 協和発酵工業の「教えない教育」が眠れる能力を目覚めさせた (日経ビジネスオンライン)
協和発酵が始めた、新しいMR教育法について。それはそれで面白い内容なのですが、興味深いのは3ページ~4ページ目にある以下の部分:
そこで協和発酵が利用したのが、文章を単語レベルに分解して意味解析を行い、統計処理して定量的な評価ができるようにするツールである。シードウィン(東京都・港区)が開発した文章解析システム「文道」だ。
(中略)
ちょっと怖い話もある。ある人がインターネット上で、退職寸前に追い込まれるほどの誹謗中傷を受けた。中傷文の内容からして、書き手は勤務先の社内にいると推測。社内のイントラネットから数人が書いた業務文書を収集して分析し、中傷文の分析結果と比較した。すると、そのうちの1人が書いた文書が、約20件の中傷文の大半と100%一致したという。文章の内容に無関係に書き手が特定されるという点は筆跡鑑定に似ているが、手で文章を書く機会が激減した昨今、文章解析はネット時代の筆跡鑑定とも言えそうだ。
要は優秀な文章解析ツールを使い、定量分析を行えば、(サンプルさえ揃っていれば)誰がどの文章を書いたかが分かると。もちろん仕事中の文章スタイルと、それ以外でのスタイルには違いがあるでしょうが、例えばニックネームで登録しているSNS上で書いた問題発言なんかも個人特定が可能になるかもしれません。
こうした文章解析のツールは、特に日本語の場合、高いお金を払わないと優秀なものを手にすることができません。しかし以前ご紹介した「emo」のように、既にASPなどの形式で個人でも気軽に文章解析ができる時代になっています。もう数年すれば、「サンプルデータをいくつか投入するだけで、指定した文章とサンプルとの一致度を算出する」なんてウェブサービスが登場するかもしれません。特にブログや Twitter など、ネット上で誰からもアクセス可能な文章であれば、それらを自動的に読み込んで個人の文章スタイルを把握するということは簡単にできてしまうはず。
さらに文章解析だけでなく、他の様々な統計データ(どの曜日のどの時間帯に文章が書かれることが多いか、どのサービス/プロバイダを使うことが多いか、天候に関する書き込みと日本全国の天気の一致度など)と組み合わせることで、個人特定が更に容易になるかもしれません(この「様々なデータの蓄積と、その分析が可能になることによって、プライバシー侵害が起きる」という話に興味のある方は、『その数学が戦略を決める』辺りを読むと面白いかも)。ただしスパマーとスパム対策手法がいたちごっこのように、「ネット上で二重人格を演出する文章術」なんて対策指南書が出てくる可能性も高いと思いますが。
コメント