Googleは、ユーザーに1つのチェックボックスをクリックするように求める新しい形式のボットのキャプチャIDをリリースしました。必要な場合にのみ画像ベースの検証を使用します。
このようなプログラムが人間とボットをどのように区別するかについて誰かに説明してもらえますか?
プログラムがあります
ここ。プログラムファイルにアクセスできないWebベースのプログラムでは検出できません。チェックボックスをオンにできる検出不可能なWindows実行可能ファイルを書き込むことができるはずです。プログラムの応答時間をランダム化することもできます。
数回(成功)試行した後、キャプチャは画像の検証を要求します。たぶんそれは、Google画像検索を使用して画像を(画像で)検索し、「視覚的に類似した」画像のファイル名に基づいて推測するAIによって解決できるでしょう。使用する画像がネットからのものでない場合は、数が制限され、データベースを作成できます。
これらのアプローチが実際に機能するかどうかを誰かが明確にできますか?
回答
Googleはアルゴリズムを秘密にしているため、これはスタックエクスチェンジにとってあまり良い質問ではありません。実際にできることは、それがどのように行われるかを推測することだけです。動作しますが、新しいシステムは、Googleのすべてのサービス(および、Google広告があるウェブサイトなど、Googleが管理している他のサイト)全体のアクティビティを分析することを理解しています。
したがって、 、チェックボックスがオンになっているページだけにチェックが限定されていない可能性があります。たとえば、使用しているコンピュータ/ IPアドレスが過去に通常の人間が行うこと(Gmailの確認、Google検索での検索、ドライブへのファイルのアップロード、写真の共有、閲覧など)にも使用されていることを検出した場合ウェブなど-そうすれば、あなたが人間であることが合理的に確信でき、画像の検証をスキップできるようになります。一方、コンピュータを以前の人間のような活動に関連付けることができない場合は、より疑わしくなり、画像を確認できます。チェックボックスをクリックしたときのマウスの動作が分析の1つの要因である可能性がありますが、ほぼ確実にそれ以上のものがあります。
繰り返しになりますが、それがどのように機能するかはわかりません。これは、Googleがほとんど言っていないことに基づいた私の最善の推測です。
新しいreCAPTCHAAPIは単純に聞こえるかもしれませんが、背後には高度な洗練があります。その控えめなチェックボックス。 CAPTCHAは、歪んだテキストをロボットが解決できないことに長い間依存してきました。しかし、私たちの調査によると、今日の人工知能技術は、歪んだテキストの最も難しいバリアントでも99.8%の精度で解決できることがわかっています。したがって、歪んだテキスト自体は、もはや信頼できるテストではありません。
これに対抗するために、昨年、ユーザーのCAPTCHAへの関与全体を積極的に検討するreCAPTCHAの高度なリスク分析バックエンドを開発しました。中および後—そのユーザーが人間であるかどうかを判断します。これにより、歪んだテキストの入力に依存することが少なくなり、ユーザーのエクスペリエンスが向上します。これについては、今年初めのバレンタインデーの投稿で話しました。
「使用前、使用中、使用後」についてのポイントは、強力なヒントです。以前のブラウジング動作を分析しますが、私の解釈は間違っている可能性があります。
ここに「WIREDからの引用:
依存する代わりに従来の歪んだ単語のテストで、Googleの「reCaptcha」はすべてのユーザーが無意識のうちに提供する手がかりを調べます。IPアドレスとCookieは、ユーザーがWeb上の他の場所から覚えているのと同じ友好的な人間であるという証拠を提供します。Shetは、ユーザーのマウスの小さな動きでさえチェックボックスをホバリングして近づくと、自動化されたボットを表示するのに役立ちます。
スタックオーバーフローには、これについても説明している別のスレッドがあります: https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work
画像の確認に関しては、逆の画像でそれらの画像を見つけることはできません。検索、またはコンパイルそれらのデータベース。これらは通常、Googleのストリートビューカーによってキャプチャされたランダムな街路標識や家の番号、またはGoogleブックスプロジェクトのためにスキャンされた本からの単語です。これには良い目的があります。Googleは実際に人々がreCaptchaに入力したものを利用します。独自のデータベースを改善し、OCRアルゴリズムをトレーニングします。reCaptchaは多くのユーザーに同じ画像を提供し、すべてのユーザーがその内容に同意すると、その画像がGoogleのAIのトレーニングデータになります。
ウィキペディアから:
reCAPTCHAサービスは、光学式文字認識(OCR)ソフトウェアでは不可能だった単語の画像を購読Webサイトに提供します。読む。購読しているWebサイト(その目的は一般に本のデジタル化プロジェクトとは無関係です)は、通常の検証手順の一部として、人間がCAPTCHAの単語として解読できるようにこれらの画像を表示します。次に、結果をreCAPTCHAサービスに返します。このサービスは、結果をデジタル化プロジェクトに送信します。
reCAPTCHAは、ニューヨークタイムズのアーカイブとGoogleブックスの書籍のデジタル化に取り組んできました。[3] 2012年の時点で、ニューヨークタイムズの30年間がデジタル化されており、プロジェクトは2013年末までに残りの年を完了する予定です。現在完成しているニューヨークタイムズのアーカイブは、ニューヨークタイムズの記事アーカイブから検索できます。 1851年から現在までの合計1,300万件を超える記事がアーカイブされています。
コメント
回答
私も、このことに驚いています。そこで、Chromeでシークレットモードを開いて、新しいGoogle CAPTCHAがあるサイトを閲覧し、チェックボックスをオンにしました。まあ、それは私を通り抜けませんでした、代わりにそれは一連の画像を表示し、1つの画像に関連する画像を選択するように私に頼みました。
コメント
商用トラック"は、ここアメリカでは何の意味もありません。さらに興味深いことに、Googleは地理的にコンテキストに沿ったものにしています。
また、 Chrome は Googleの製品でもあります。
回答
をクリックすると私はロボットではありません HTTPリクエストを介してGoogleに送信し、
- あなたのIPアドレス
- あなたの国<などの役立つ情報をすべて提供します。 / li>
- タイムスタンプ
チェックボックスに入る直前のカーソルの移動方法など、ブラウザからの情報。クリックする前のページのスクロール方法。間の時間間隔さまざまなブラウザイベントや、Googleが秘密にしている他の多くの変数。
これらの基準はすべて、Googleの機械学習リスク分析によって処理され、ほとんどの場合、情報によって人間とボットの違いがわかりますが、リスク分析エンジンがまだ不明な場合は、ごく一部のユーザーが追加の課題。
そこで画像認識CAPTCHA が登場します。この方法で人間であることを証明した場合そうすれば、Googleのエンジンが記憶し、次にそのチェックボックスをクリックした後、これらをそのまま通過できる可能性があります。
回答
私が見た限りでは、ロジックは次のようになります。
- ユーザーが(ブラウザの)Googleアカウントにログインしていない場合、ユーザーは目に見えるキャプチャを取得します。
- ユーザーがログインしている場合、以前の(おそらくGoogle全体の)アクティビティ履歴に応じて(そのページまたはそこに移動する前のいずれかで、2つのシナリオが考えられます。
- キャプチャが取得されない
- キャプチャが簡単になります(つまり、4つの迷路ではなく1つの迷路)
よく理解できないのは、アルゴリズムにcheckbox
キャプチャが使用されている場合です。すでに人間であることが検出されています。
コメント
回答
それはいくつかのことをします。それはあなたのIPアドレスとクッキーをチェックします。クリックする前に、クリックとマウスの動きを確認します。自動クリックツールを使用すると、米国はグーグルがあなたに絵を与えるようにします。