Firma Google udostępniła nową formę identyfikacji botów captcha, która wymaga od użytkownika kliknięcia pojedynczego pola wyboru. Używa weryfikacji na podstawie obrazu tylko wtedy, gdy jest to konieczne.
Czy ktoś mógłby mi wyjaśnić, w jaki sposób taki program odróżnia człowieka od bota?
Istnieje program tutaj , który może wykonywać kliknięcia myszą na komputerze. Nie może zostać wykryty przez program internetowy bez dostępu do plików programu. Powinno być możliwe napisanie niewykrywalnego pliku wykonywalnego systemu Windows, który może zaznaczyć pole wyboru. Można również losowo ustawić czas odpowiedzi programu.
Po kilku (udanych) próbach captcha poprosi o weryfikację obrazu. Być może uda się to rozwiązać za pomocą sztucznej inteligencji, która wyszukuje obrazy za pomocą wyszukiwarki grafiki Google (według obrazu) i zgaduje na podstawie nazw plików „wizualnie podobnych”. Jeśli użyte obrazy nie pochodzą z sieci, ich liczba byłaby ograniczona i można by stworzyć ich bazę danych.
Czy ktoś mógłby wyjaśnić, czy te podejścia mogą faktycznie zadziałać?
Odpowiedź
To naprawdę nie jest dobre pytanie do wymiany stosów, ponieważ Google utrzymuje swoje algorytmy w tajemnicy, więc wszystko, co naprawdę możemy zrobić, to zgadnąć, jak to działa działa, ale rozumiem, że nowy system będzie analizował Twoją aktywność we wszystkich usługach Google (i prawdopodobnie w innych witrynach, nad którymi Google ma pewną kontrolę, np. w witrynach z reklamami Google).
W związku z tym , jest prawdopodobne, że kontrole nie są ograniczone tylko do strony, na której znajduje się pole wyboru. Na przykład, jeśli wykryją, że Twój komputer / adres IP, którego używasz, był również używany w przeszłości do robienia rzeczy, które robiłby normalny człowiek – na przykład do sprawdzania Gmaila, wyszukiwania w wyszukiwarce Google, przesyłania plików na Dysk, udostępniania zdjęć, przeglądania Internet itp. – wtedy prawdopodobnie można mieć dość pewną pewność, że jesteś człowiekiem i możesz pominąć weryfikację obrazu. Z drugiej strony, jeśli nie może powiązać twojego komputera z żadną wcześniejszą działalnością podobną do człowieka, będzie bardziej podejrzana i umożliwi weryfikację obrazu. Chociaż zachowanie myszy podczas klikania pola wyboru może być jednym z analizowanych czynników, jest prawie na pewno dużo więcej.
Ponownie, nie wiemy na pewno, jak to działa. To tylko moje przypuszczenie na podstawie tego, co powiedział mały Google:
Chociaż nowy interfejs API reCAPTCHA może wydawać się prosty, kryje się za nim wysoki stopień wyrafinowania to skromne pole wyboru. CAPTCHA od dawna polegają na niezdolności robotów do rozwiązywania zniekształconego tekstu. Jednak nasze badania wykazały niedawno, że dzisiejsza technologia sztucznej inteligencji może rozwiązać nawet najtrudniejszy wariant zniekształconego tekstu z dokładnością 99,8%. Zniekształcony tekst sam w sobie nie jest już niezawodnym testem.
Aby temu przeciwdziałać, w zeszłym roku opracowaliśmy zaplecze zaawansowanej analizy ryzyka dla reCAPTCHA, które aktywnie bierze pod uwagę całe zaangażowanie użytkownika w CAPTCHA – wcześniej, w trakcie i po – aby określić, czy dany użytkownik jest człowiekiem. Dzięki temu możemy mniej polegać na pisaniu zniekształconego tekstu, co z kolei zapewnia lepsze wrażenia użytkownikom. Rozmawialiśmy o tym w naszym poście walentynkowym na początku tego roku.
Dla mnie kwestia „przed, w trakcie i po użyciu” jest mocną wskazówką że analizują poprzednie zachowanie przeglądania, ale moja interpretacja może być błędna.
Oto cytat z WIRED:
Zamiast polegać na podstawie tradycyjnego testu zniekształconych słów Google „reCaptcha” bada wskazówki, które każdy użytkownik nieświadomie podaje: adresy IP i pliki cookie stanowią dowód, że użytkownik jest tym samym przyjaznym człowiekiem, który Google zapamiętuje z innego miejsca w sieci. Shet mówi, że nawet drobne ruchy myszy użytkownika sprawia, że gdy się unosi i zbliża, pole wyboru może pomóc w ujawnieniu automatycznego bota.
Jest też inny wątek na temat stackoverflow, w którym omawia się to również: https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work
Jeśli chodzi o weryfikację obrazu, nie będziesz w stanie znaleźć tych obrazów z odwróconym obrazem wyszukaj lub skompiluj plik ich baza danych. Zwykle są to przypadkowe znaki ulic lub numery domów zarejestrowane przez samochody Google Street View lub słowa z książek zeskanowanych na potrzeby projektu Google Books. Ma to dobry cel – Google faktycznie wykorzystuje to, co ludzie wpisują w reCaptcha, aby ulepszać własne bazy danych i trenować algorytmy OCR. reCaptcha daje ten sam obraz wielu użytkownikom i jeśli wszyscy zgadzają się co do tego, co jest napisane, obraz staje się danymi szkoleniowymi dla sztucznej inteligencji Google.
Z wikipedii:
Usługa reCAPTCHA dostarcza stronom subskrybującym obrazy słów, których oprogramowanie optycznego rozpoznawania znaków (OCR) nie było w stanie czytać. Subskrybujące strony internetowe (których cele są generalnie niezwiązane z projektem digitalizacji książek) przedstawiają te obrazy, aby ludzie mogli je rozszyfrować jako słowa CAPTCHA, w ramach ich normalnych procedur walidacji. Następnie zwracają wyniki do usługi reCAPTCHA, która wysyła wyniki do projektów digitalizacji.
reCAPTCHA pracowała nad digitalizacją archiwów The New York Times i książek z Google Books. [3] Od 2012 r. Trzydzieści lat The New York Times zostało zdigitalizowane, a projekt planowano zakończyć pozostałe lata do końca 2013 r. Ukończone już archiwum The New York Times można przeszukać w archiwum artykułów New York Times, gdzie zarchiwizowano łącznie ponad 13 milionów artykułów, począwszy od 1851 roku do dnia dzisiejszego.
Komentarze
- Czy możesz podać źródła swojej odpowiedzi?
- Możesz mieć rację. Zastanawiałem się nad możliwym konfliktem z ich Polityką prywatności , ale czytając ogólnie, w jaki sposób została sformułowana, a zwłaszcza z ich Sposób, w jaki wykorzystujemy gromadzone informacje , wydaje się zgodny: « Używamy informacji, które zbieramy ze wszystkich naszych usług, aby świadczyć, utrzymywać, chronić je i ulepszać, opracowywać nowe oraz chronić Google i naszych użytkowników. Używamy również tych informacji, aby oferować dostosowane treści ».
- Jednak nigdy nie blokują one użytkownika, jeśli wyczyścisz test obrazu. (niezależnie od wcześniejszej historii)
- Cześć! Uważam, że ta odpowiedź jest naprawdę interesująca. Ale jeśli Google jest już prawie pewien, że ' jesteś człowiekiem, dlaczego w ogóle przejmujesz się wyświetlaniem CAPTCHA?
- @EliRose Znaczna część reCaptcha implementacja to sprawdzanie widżetu po stronie serwera ' tokenu bezpieczeństwa . Witryna musi sprawdzić, czy ' nie jest podszywana. Dzieje się tak podczas interakcji użytkownika z widżetem.
Odpowiedź
Również zadziwia mnie to. Więc, co zrobiłem, w Chrome otwórz tryb incognito, a następnie przeglądaj witrynę, która ma nowy Google CAPTCHA i zaznacz pole. Cóż, nie udało mi się przez to przejść, zamiast tego pokazuje serię obrazów i prosi o wybranie obrazów powiązanych z jednym obrazem.
To pokazuje, że Google stale śledzi nasze zachowanie, aby określić, czy jesteśmy ludźmi czy nie.
Komentarze
Odpowiedź
Po kliknięciu Nie jestem robotem wysyła żądanie HTTP do Google z całą masą przydatnych informacji, takich jak
- Twój adres IP
- Twój kraj
- Sygnatura czasowa
Informacje z przeglądarki, takie jak sposób przesuwania kursora tuż przed wprowadzeniem pola wyboru. Sposób przewijania strony przed kliknięciem. Odstęp czasu między różne zdarzenia przeglądarki i wiele innych zmiennych, które Google utrzymuje w tajemnicy.
Wszystkie te kryteria są następnie przetwarzane przez analizę ryzyka systemów uczących się w Google i przez większość czasu informacje mogą odróżnić człowieka od robota, ale jeśli silnik analizy ryzyka nadal nie jest pewien, niewielki procent użytkowników często wypełnia plik dodatkowe wyzwanie.
W tym miejscu pojawia się Rozpoznawanie obrazu CAPTCHA . Jeśli w ten sposób udowodnisz, że jesteś człowiekiem wtedy jest szansa, że silnik Google zapamięta i następnym razem po kliknięciu tego pola wyboru będziesz mógł przejść przez nie od razu.
Odpowiedź
O ile widziałem, logika jest następująca:
- Jeśli użytkownik nie jest zalogowany na koncie Google (w przeglądarce), otrzyma widoczną captcha.
- Jeśli użytkownik jest zalogowany w , to w zależności od Twojej poprzedniej (prawdopodobnie w Google) historii aktywności ( albo na tej stronie, albo przed przejściem do niej), istnieją dwa możliwe scenariusze:
- Nie dostaniesz żadnego captcha
- Uzyskasz łatwiejszą captcha (tj. 1 labirynt zamiast 4 labiryntów)
To, czego nie mogę dobrze zrozumieć, to zastosowanie znaków captcha checkbox
, gdy algorytm ma już wykryto, że jesteś człowiekiem.
Komentarze
- Pole wyboru gwarantuje, że dane dotyczące ruchu myszy muszą być rejestrowane w celu przesłania captcha, między inne rzeczy
Odpowiedz
Robi kilka rzeczy. Sprawdza Twój adres IP i pliki cookie. Sprawdza, jak klikasz i porusza się Twoja mysz, zanim klikniesz. Używanie narzędzia do automatycznego klikania sprawia, że Google daje Ci obraz.
Ciężarówka komercyjna ” nic dla nas nie znaczy w USA. A więc jeszcze bardziej interesujące jest to, że Google dostosowuje go do kontekstu geograficznego.