Google hat eine neue Form der Captcha-Identifizierung von Bots veröffentlicht, mit der der Benutzer aufgefordert wird, auf ein einzelnes Kontrollkästchen zu klicken. Es wird nur bei Bedarf eine bildbasierte Überprüfung verwendet.
Könnte mir bitte jemand erklären, wie ein solches Programm einen Menschen von einem Bot unterscheidet?
Es gibt ein Programm hier , das Mausklicks auf Ihrem Computer ausführen kann. Es kann von einem webbasierten Programm ohne Zugriff auf Ihre Programmdateien nicht erkannt werden. Es sollte möglich sein, eine nicht nachweisbare ausführbare Windows-Datei zu schreiben, die das Kontrollkästchen aktivieren kann. Man könnte auch die Antwortzeit des Programms zufällig festlegen.
Nach einigen (erfolgreichen) Versuchen fordert das Captcha eine Bildüberprüfung an. Möglicherweise kann dies durch eine KI gelöst werden, die die Bilder mithilfe der Google Bildsuche (nach Bild) durchsucht und anhand der Dateinamen „visuell ähnlicher“ Bilder Vermutungen anstellt. Wenn die verwendeten Bilder nicht aus dem Netz stammen, ist ihre Anzahl begrenzt, und man könnte eine Datenbank davon erstellen.
Könnte jemand klären, ob diese Ansätze tatsächlich funktionieren könnten?
Antwort
Dies ist keine wirklich gute Frage für den Stapelaustausch, da Google seine Algorithmen geheim hält, sodass wir nur raten können, wie es geht funktioniert, aber nach meinem Verständnis analysiert das neue System Ihre Aktivitäten in allen Google-Diensten (und möglicherweise auch auf anderen Websites, über die Google eine gewisse Kontrolle hat, z. B. Websites mit Google-Anzeigen).
So. Es ist wahrscheinlich, dass die Überprüfungen nicht nur auf die Seite beschränkt sind, auf der sich das Kontrollkästchen befindet. Wenn sie beispielsweise feststellen, dass Ihre von Ihnen verwendete Computer- / IP-Adresse in der Vergangenheit auch verwendet wurde, um Dinge zu tun, die ein normaler Mensch tun würde – beispielsweise Google Mail überprüfen, in der Google-Suche suchen, Dateien auf Drive hochladen, Fotos freigeben, surfen das Web usw. – dann kann es wahrscheinlich ziemlich sicher sein, dass Sie ein Mensch sind und Ihnen erlauben, die Bildüberprüfung zu überspringen. Wenn es Ihren Computer jedoch nicht mit einer früheren menschenähnlichen Aktivität in Verbindung bringen kann, ist er verdächtiger und gibt Ihnen die Bildüberprüfung. Auch wenn das Verhalten der Maus beim Klicken auf das Kontrollkästchen ein Faktor ist, den es analysiert, Es steckt mit ziemlicher Sicherheit noch viel mehr dahinter.
Auch hier wissen wir nicht genau, wie es funktioniert. Dies ist nur meine beste Vermutung, basierend auf dem, was Google gesagt hat:
Während die neue reCAPTCHA-API einfach klingt, steckt ein hohes Maß an Raffinesse dahinter dieses bescheidene Kontrollkästchen. CAPTCHAs verlassen sich seit langem auf die Unfähigkeit von Robotern, verzerrten Text zu lösen. Unsere kürzlich durchgeführten Untersuchungen haben jedoch gezeigt, dass die heutige Technologie der künstlichen Intelligenz selbst die schwierigste Variante von verzerrtem Text mit einer Genauigkeit von 99,8% lösen kann. Daher ist verzerrter Text für sich genommen kein verlässlicher Test mehr.
Um dem entgegenzuwirken, haben wir im vergangenen Jahr ein erweitertes Backend für die Risikoanalyse für reCAPTCHA entwickelt, das die gesamte Beschäftigung eines Benutzers mit CAPTCHA aktiv berücksichtigt. während und nach – um festzustellen, ob dieser Benutzer ein Mensch ist. Dies ermöglicht es uns, uns weniger auf die Eingabe von verzerrtem Text zu verlassen und den Benutzern eine bessere Benutzererfahrung zu bieten. Wir haben Anfang dieses Jahres in unserem Valentinstagspost darüber gesprochen.
Für mich ist der Punkt „vor, während und nach dem Gebrauch“ ein starker Hinweis dass sie das vorherige Surfverhalten analysieren, aber meine Interpretation könnte falsch sein.
Hier „ein Zitat von WIRED:
Anstatt abhängig zu sein Beim traditionellen Test auf verzerrte Wörter untersucht Googles „reCaptcha“ Hinweise, die jeder Nutzer unabsichtlich bereitstellt: IP-Adressen und Cookies beweisen, dass der Nutzer derselbe freundliche Mensch ist, an den sich Google von anderen Stellen im Web erinnert. Und Shet sagt sogar die winzigen Bewegungen der Maus eines Nutzers Wenn ein Mauskästchen schwebt und sich nähert, kann dies dazu beitragen, einen automatisierten Bot anzuzeigen.
Es gibt einen weiteren Thread zum Stackoverflow, der dies ebenfalls diskutiert: https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work
Bei der Bildüberprüfung können Sie diese Bilder mit umgekehrtem Bild nicht finden suchen oder kompilieren a Datenbank von ihnen. In der Regel handelt es sich dabei um zufällige Straßenschilder oder Hausnummern, die von den Street View-Fahrzeugen von Google erfasst wurden, oder um Wörter aus Büchern, die für das Google Books-Projekt gescannt wurden. Dahinter steckt ein guter Zweck: Google verwendet tatsächlich, was in reCaptcha eingegeben wird Verbessern Sie Ihre eigenen Datenbanken und trainieren Sie OCR-Algorithmen. reCaptcha gibt einer Reihe von Benutzern dasselbe Bild. Wenn sich alle einig sind, was darin steht, wird das Bild zu Trainingsdaten für die KI von Google.
Aus Wikipedia:
Der Dienst reCAPTCHA liefert abonnierenden Websites Bilder von Wörtern, die mit der OCR-Software (Optical Character Recognition) nicht möglich waren lesen. Die abonnierenden Websites (deren Zweck im Allgemeinen nicht mit dem Buchdigitalisierungsprojekt zusammenhängt) präsentieren diese Bilder, damit Menschen sie im Rahmen ihrer normalen Validierungsverfahren als CAPTCHA-Wörter entschlüsseln können. Anschließend senden sie die Ergebnisse an den reCAPTCHA-Dienst zurück, der die Ergebnisse an die Digitalisierungsprojekte sendet.
reCAPTCHA hat an der Digitalisierung der Archive der New York Times und der Bücher von Google Books gearbeitet. [3] Bis 2012 waren 30 Jahre New York Times digitalisiert worden, und das Projekt sollte die verbleibenden Jahre bis Ende 2013 abgeschlossen haben. Das jetzt fertiggestellte Archiv der New York Times kann im Artikelarchiv der New York Times durchsucht werden. Insgesamt wurden mehr als 13 Millionen Artikel von 1851 bis heute archiviert.
Kommentare
- Können Sie Quellen für Ihre Antwort angeben?
- Sie haben möglicherweise Recht. Ich habe mich über einen möglichen Konflikt mit ihrer Datenschutzrichtlinie gewundert, aber die breite Formulierung gelesen, insbesondere mit ihrer Wie wir die von uns gesammelten Informationen verwenden , scheint dies kompatibel zu sein: « Wir verwenden die Informationen, die wir aus all unseren Diensten sammeln, um bereitzustellen, zu pflegen, Schützen und verbessern Sie sie, entwickeln Sie neue und schützen Sie Google und unsere Nutzer. Wir verwenden diese Informationen auch, um Ihnen maßgeschneiderte Inhalte » anzubieten.
- Sie werden jedoch niemals blockiert, wenn Sie den Bildtest löschen. (unabhängig von der Vorgeschichte)
- Hi! Ich fand diese Antwort wirklich interessant. Aber wenn Google bereits ziemlich sicher ist, dass Sie ‚ ein Mensch sind, warum macht es sich dann die Mühe, überhaupt ein CAPTCHA anzuzeigen?
- @EliRose Ein wesentlicher Teil des reCaptcha Die Implementierung ist eine serverseitige Überprüfung des Sicherheitstokens des Widgets ‚ . Die Website muss überprüfen, ob ‚ nicht gefälscht wird. Dies geschieht bei Benutzerinteraktion mit dem Widget.
Antwort
Ich bin auch immer erstaunt über diese Sache. Also, was ich getan habe, im Chrome-Inkognito-Modus öffnen, dann eine Website mit dem neuen Google CAPTCHA durchsuchen und das Kästchen ankreuzen. Nun, es hat mich nicht durchgebracht, stattdessen zeigt es eine Reihe von Bildern und hat mich gebeten, Bilder auszuwählen, die sich auf ein Bild beziehen.
Dies zeigt, dass Google unser Verhalten ständig verfolgt, um festzustellen, ob wir Menschen sind oder nicht.
Kommentare
Antwort
Wenn Sie auf klicken, bin ich kein Roboter sendet eine HTTP-Anfrage an Google mit allen nützlichen Informationen wie
- Ihrer IP-Adresse
- Ihrem Land
- Zeitstempel
Informationen aus Ihrem Browser, z. B. die Art und Weise, wie Sie den Cursor unmittelbar vor dem Aufrufen des Kontrollkästchens bewegen. So scrollen Sie die Seite vor dem Klicken. Das Zeitintervall zwischen Verschiedene Browserereignisse und viele andere Variablen, die Google geheim hält.
Alle diese Kriterien werden dann bei Google durch Risikoanalyse für maschinelles Lernen verarbeitet. In den meisten Fällen können die Informationen jedoch den Unterschied zwischen einem Menschen und einem Bot erkennen Wenn die Risikoanalyse-Engine immer noch unsicher ist, führt der kleine Prozentsatz der Benutzer häufig eine aus zusätzliche Herausforderung.
Hier kommt Bilderkennung CAPTCHA ins Spiel. Wenn Sie auf diese Weise beweisen, dass Sie ein Mensch sind Dann wird sich die Google-Engine wahrscheinlich daran erinnern, und wenn Sie das nächste Mal auf dieses Kontrollkästchen klicken, können Sie diese direkt durchgehen.
Antwort
Soweit ich gesehen habe, lautet die Logik wie folgt:
- Wenn der Benutzer nicht im Google-Konto (im Browser) angemeldet ist, erhält er ein sichtbares Captcha.
- Wenn der Benutzer in angemeldet ist, hängt dies von Ihrem vorherigen (wahrscheinlich über Google) Aktivitätsverlauf ab ( Entweder auf dieser Seite oder bevor Sie dorthin navigiert sind, gibt es zwei mögliche Szenarien:
- Sie erhalten kein Captcha
- Sie erhalten ein einfacheres Captcha (dh 1 Labyrinth anstelle von 4 Labyrinthen).
Was ich nicht gut verstehen kann, ist die Verwendung von checkbox
Captchas, wenn der Algorithmus hat bereits erkannt, dass Sie ein Mensch sind.
Kommentare
- Das Kontrollkästchen stellt sicher, dass Mausbewegungsdaten aufgezeichnet werden müssen, um das Captcha zu senden andere Dinge
Antwort
Es macht verschiedene Dinge. Es überprüft Ihre IP-Adresse und Cookies. Es wird angezeigt, wie Sie klicken und Ihre Maus bewegt, bevor Sie klicken. Wenn Sie ein Auto-Klick-Tool verwenden, erhalten Sie von Google in der Regel ein Bild.
Nutzfahrzeug “ bedeutet uns hier in den USA nichts. Umso interessanter ist es, dass Google es geografisch kontextbezogen macht.