アンドロイド

Googleがボットビートに役立つトップヒントを提供

’, Â, � etc... How to fix strange encoding characters in WP or other SQL database

’, Â, � etc... How to fix strange encoding characters in WP or other SQL database
Anonim

Googleなどのウェブサービスは、ウェブサイトが人間の訪問者とボットを区別するのを助ける、CAPTCHAに新しい動きをもたらしました。それは、人々が一連のランダムに回転した画像、人間が簡単に見つけることができ、コンピュータが難しいという課題を抱えています。スパマーは、ソフトウェアを使用して、迷惑メールを送信するHotmailやGmailなどのサービスで数千のWebメールアカウントを自動的に作成し始めた時、CAPTCHA

典型的なCAPTCHAはビジターに対して、忙しい背景に対して一連の歪んだ文字と数字を含むイメージを見て、入力するように要求します。それらの文字列 見る。

[さらに読む:最高のテレビストリーミングサービス]

しかし、OCR(Optical Character Recognition:光学式文字認識)は、人間が文字の形を簡単に認識することができるというアイデアです。 )ソフトウェアはより洗練されており、CAPTCHAの開発者は多くの人間が困っているほど難解な課題を抱えてしまっている。

グーグルの答えは、訪問者に画像をランダムに回転させて表示する方法である。画像はランダムに回転され、慎重に選択されます。まず、青空(容易に検出される)、テキスト(簡単に認識される)または人々の肖像(市場に多数の顔認識アプリケーションがある)の風景を示す写真など、自分のコンピュータがトップを容易に識別できる画像を除外する。 。次に、人が一種の意見調査を行うことによって、(例えば、抽象的な芸術やオーバーヘッドビューなどの、容易に識別可能なトップを持たない)方向づけが困難なイメージを除外します。

Googleが適切な方向に合った適切な画像のプールを作成することができるため、プロセスの鍵となります。

オリエンテーションを知っている一連の画像と、 Googleはボットを除外し、未知の画像に関する統計を着実に蓄積することができます。訪問者がどちらに合っているかに同意する傾向がある場合は、それを含めることが適切であり、一致しない場合、画像が難しくなります。 Gossweiler、Maryam Kamvar、Shumeet Balujaは、「What's Up CAPTCHA?」という論文の画像選択プロセスについて説明しています。来週の木曜日、マドリッドのWWW 2009カンファレンスで発表する予定です。

彼らはCAPTCHAで写真を使うことを最初に検討する人ではありません。たとえば、2007年8月、マイクロソフトは訪問者に猫と犬を区別してスパムボットを阻止しようとしました。しかし、最近の顔認識ソフトウェアの進歩により、このアプローチは時代遅れです。AppleのiPhotoアプリケーションは、猫の顔を持っているが、犬に問題があるため、意図的に両者を区別できるソフトウェアが遠くないかもしれないことを示唆している。

しかし、巧みなGoogleの取得は、スパマーがより洗練されているかもしれない。現在のCAPTCHA作物を解体したり、ゲームとしての挑戦を提示したり、低所得国の人々にそれを解決したり、ポルノサイトへのアクセス手段としてCAPTCHAを再編したりするために、人間を採用しているという証拠があります。そのような攻撃に対して、Googleができることはほとんどありません。