カーネギーメロン大学の研究者達が、たった1枚の写真だけで、それが撮られた場所を特定する技術を開発したとのこと。面白いことに、Flickr 上にアップされている写真を比較対象としているそうです:
■ New Computerized System Estimates Geographic Location Of Photos (ScienceDaily)
"IM2GPS"というのが今回開発された技術の名前。写真の中に写り込んでいるモノを認識する(例えばたまたま写っている看板の文字を認識するなど)のではなく、画像全体の色合いやテクスチャを解析、それと似た傾向を持つ 画像を Flickr 上から検索 -> その Flickr 画像の撮影場所情報を参考にする、という仕組みだそうです。要は最近のウェブサービスでも一般的になりつつある「似た画像を探す」という技術を使って、どこで撮影されたかが既に分かっている画像を参照するという訳ですね。
では実際のサンプルを。こちらはお馴染み、パリのノートルダム寺院の写真です:
左が解析したい写真で、右が Flickr の中から類似しているとしてピックアップされた画像。ご覧のように、何枚か似ているけれどノートルダム寺院ではない写真が含まれていますが、ほとんどの写真の撮影場所はパリ。ということで、オリジナル画像の撮影場所はパリの可能性が高いと判断される、と。
こちらは全ての類似画像を地図上にプロットして、撮影場所の可能性がある地点を示したもの。いくつか北米・南米にも点が現れていますが、ほとんどの画像はフランス・パリに集中していることが分かりますね。
しかし当然ながら、特徴的な建物や地形が写っていない写真では、精度はがくんと落ちます。例えばこちらは、絵はがきにでもありそうな風景を撮影したもの:
山と草地と牛。これだけで場所特定できたら逆にスゴイですが、やはり似ているとして選び出された画像にはバラつきがあります。フランス、スイス、ベルギー、アイルランド、そしてタイやウガンダまで。類似画像の検索に頼るのではこれが限界かなという気もしますが、それでもヨーロッパの風景に近いということまでは分かります。またこれだけ可能性が絞れれば、あとは人間の目で見て判断するということもできますね。
その他、大量のサンプルがこちらのページに掲載されていますので、精度を確認してみて下さい。
しかし Flickr など画像共有サービスには日々大量のデータがアップされるわけですから、それと画像検索技術を組み合わせれば、地形以外でも「写っているものが何か」という分析ができてしまうわけですよね。行方不明者を捜す、といった有意義な使い道に利用されることも多いと思いますが、場合によってはプライバシー侵害みたいなケースが起きるのかなぁと不安に感じた次第です(もうプライバシーなんてものは存在しない、という意見もありますが)。
またこの技術があれば、「写真に写っているモノは何か」という判別も容易になる可能性が指摘されています。例えば「この写真は日本で撮られた可能性がある」ということになれば、「人間が手に持っているのはお箸かもしれない」ということになると。逆にモノを認識する技術と組み合わせる――例えば冒頭で「写っている看板の文字を認識するといったことはしていない」と書きましたが、そういった判断も一緒に行うようにすれば、より「この写真が撮られたのはどこか、何が写っている写真か」が正しく認識されるようになっていくのかもしれません。
【関連記事】
コメント