アンドロイド

Google:画像検索で画期的な成果をあげました

Sweet Tart Dough Recipe - LeGourmetTV

Sweet Tart Dough Recipe - LeGourmetTV
Anonim

人間はパターン認識に優れているかもしれませんが、コンピュータは画像を識別するのにあまりスマートではありません。私たちの脳は、自由の女神や万里の長城などの有名なランドマークの写真をすぐに識別することができますが、コンピュータは一般的にチートシートのようなテキストタグなしでは無知です。

"コンピュータビジョン"が狂う。検索巨人は、マイアミで開催されたコンピュータビジョンとパターン認識(CVPR)会議で、ランドマーク認識に関する論文を発表した。新技術により、コンピュータは迅速にI.D. Googleは現在、パターン認識技術はまだ研究プロジェクトであり、新しいサービスではないことを指摘している。つまり、10回の試行のうち8回だけが検索ツールとして重要な意味を持ちません。それでも、コンセプトはかなり涼しく、いつGoogleがいつも正確率を上げることができるなら、旅行者に恩恵を与えることができる。未確認のランドマークの写真をスナップして、スマートフォンやネット対応のカメラですぐに認識できるようにすることは人気が高いと思います。もちろん、誰もまだ考えていない科学的および消費者向けアプリケーションの可能性もあります。

それではどうしますか? Googleのコンピュータビジョン調査の責任者、Jay Yagnikはブログ記事で説明しています。まず、2つのGoogleサービス(PicasaとPanoramio)からの4,000万のGPSタグ付き写真とオンラインツアーガイドウェブページを使用してランドマークのリストを作成します。次に、これらのソースとGoogle Image Searchを使用して各ランドマークの候補画像を見つけ出し、効率的な画像マッチングと教師なしクラスタリング手法を使用して「剪定」しました。高速画像認識。しかし、プロジェクトの賢明さにもかかわらず、正確な画像検索は依然として難しい。以下の写真が示すように、無関係のランドマークは同様のアーキテクチャ上の特徴を共有することがあります。また、巨大なバナーや旗が含まれていると、誤った一致が起こる可能性があります。

Googleの調査プロジェクトでは画像検索が改善され、今日はタグ付けに頼っていることを望みます。次のステップは、無数の非ランドマーク画像を識別する方法を見つけることですが、その作業は無限に難しいようです。