グーグルの類似画像検索の精度が高い理由
グーグルの検索機能の一つとして、ある画像と類似した画像を検索してくれるというものがあります。
使い方は簡単で、
画像検索をした後
画像にマウスオーバし、「類似の画像」をクリック
一番左上に表示されるのがクエリ画像(「これと似ている画像を検索」の「これ」)です。
トマトがたくさん写っているものをクエリに
トマトが木になっているものをクエリに
なかなかの精度です。
ここでのポイントは、「たくさんのリンゴ」や、「枝になっているイチゴ」が結果に表示されることはほとんどなく、かなりの高確率で、それはトマトであるという点です。
画像の自動認識に携わったり、その実力を試したことがある方なら分かると思うのですが、画像のみからそれがトマトであるのかリンゴであるのかを判別するのが、いかに難しいことか。
トマトの画像と似たものを集めようとした場合、リンゴやらイチゴやらサクランボやら日の丸やら、赤くて丸っぽい他のものが検索結果に引っかかってきてしまうのを避けるのは、非常に難しいことだと思われます。
試しに、日立の類似画像検索サービス「GazoPa」に、先述のトマトがたくさん写っている写真をクエリとして検索させてみると、
トマト以外にも、リンゴ、イチゴ、ラズベリー、赤い上着、赤いバッグ、エルモなどの「雑音」がどうしても混ざってきてしまいます。
じゃあ、グーグルの類似画像検索エンジンが日立のより優れているのかというと、そう単純な話でもありません。
グーグルはちょっとずるい(うまい)やり方を取っていて、クエリ画像をウェブから指定させるやり方になっています。ウェブ上の画像には、それに付随するテキストがありますし、titleやaltタグに画像を説明するキーワードが入っていたりします。
グーグルのやり方だと、クエリ画像が「トマト」であることを知った上で検索結果を出すことができます。検索結果も、「トマト」というキーワードが紐付けられている画像の中から提示すれば、雑音を減らすことが可能になります。
しかし、グーグルのやり方の場合、クエリに関してもキーワードがどうしても必要になりますから、その場でユーザにアップさせた画像に対する検索は行えないことになります。日立の方はそれができます。
つまり、最初から違う方式でやっているものなので、精度を単純には比較できないんだなあという話。
精度を上げるために使える情報は使った方がいいでしょうから、最終的には、利用できるいろいろな情報を組み合わせて検索するようなやり方が主流になるんじゃないでしょうか。
ユーザがクエリ画像をアップする場合にも、画像とともに「トマト」というキーワードを入力することで精度があがるのなら、そのようなユーザインタフェースも有効でしょう。
ただこのやり方も、ハードディスクの中にたまった自分が撮りためた写真には通用しないので、やはり「画像のみでの類似検索」という技術が単独でも実用的なレベルになるまで進化する必要はあるんだと思います。
Google超Perfect―検索できないものはない!世界中の動画・音楽・画像を瞬殺ゲット! (INFOREST MOOK PC・GIGA特別集中講座 203)
« ウェスティンホテルは当然謝罪したけど、火に油をそそぐ結果に・・・ | トップページ | 罪にいざなう者 »
「パソコン・インターネット」カテゴリの記事
- AviUtl+VobSubでDVDの字幕が大幅にずれるときの対処方法(2018.11.03)
- Z-Waveの読み方はズィーウェイブ(2017.06.06)
- ImageMagick 7で複数ファイルのトリミングを行う(2017.03.08)
- AcrobatのPNG保存で「ディスク容量容量が不足している可能性があります」のエラーが出るときは、RGBプロファイルの埋め込みをオフにしてみる(2017.03.07)
- ポケモンGOのやめ方 ~ポケGO廃人になる前に~(2017.02.28)
コメント