Google a lansat o nouă formă de identificare captcha a roboților, care solicită utilizatorului să facă clic pe o singură casetă de selectare. Folosește verificarea bazată pe imagini numai dacă este necesar.
Poate cineva să-mi explice cum un astfel de program diferențiază un om de un bot?
Există un program aici care poate efectua clicuri de mouse pe computerul dvs. Nu poate fi detectat de un program bazat pe web fără acces la fișierele dvs. de program. Ar trebui să fie posibil să scrieți un executabil Windows nedetectabil care poate bifa caseta de selectare. De asemenea, s-ar putea randomiza timpul de răspuns al programului.
După câteva încercări (reușite), captcha va cere verificarea imaginii. Poate că acest lucru poate fi rezolvat de un AI care caută imaginile folosind Google Image Search (după imagine) și face presupuneri pe baza numelor de fișiere ale imaginilor „asemănătoare vizual”. Dacă imaginile folosite nu sunt de pe net, atunci acestea ar fi limitate ca număr și s-ar putea crea o bază de date a acestora.
Ar putea cineva să clarifice dacă aceste abordări ar putea funcționa efectiv?
Răspuns
Aceasta nu este într-adevăr o întrebare excelentă pentru stackexchange, deoarece Google își păstrează algoritmii în secret, deci tot ce putem face este să facem ghiciri despre cum funcționează, dar înțeleg că noul sistem vă va analiza activitatea în toate serviciile Google (și, eventual, pe alte site-uri pe care Google le controlează, cum ar fi site-urile web care au anunțuri Google).
Astfel , este probabil ca verificările să nu se limiteze doar la pagina care are caseta de selectare. De exemplu, dacă detectează că computerul / adresa IP pe care o utilizați a fost folosită și în trecut pentru a face lucruri pe care le-ar face un om normal – lucruri precum verificarea Gmail, căutarea în căutarea Google, încărcarea fișierelor în Drive, partajarea fotografiilor, navigarea web etc. – atunci poate fi probabil destul de sigur că sunteți un om și vă permite să omiteți verificarea imaginii. Pe de altă parte, dacă nu vă poate asocia computerul cu orice activitate anterioară asemănătoare omului, atunci ar fi mai suspect și vă va oferi verificarea imaginii. Deși comportamentul mouse-ului în timp ce face clic pe caseta de selectare poate fi un factor pe care îl analizează, aproape sigur există multe altele.
Din nou, nu știm sigur cum funcționează. Aceasta este doar cea mai bună presupunere a mea, bazată pe ceea ce a spus puțin Google:
În timp ce noua reCAPTCHA API poate părea simplă, există un grad ridicat de sofisticare în spatele acea căsuță modestă. CAPTCHA s-au bazat mult timp pe incapacitatea roboților de a rezolva textul distorsionat. Cu toate acestea, cercetările noastre au arătat recent că tehnologia inteligenței artificiale de astăzi poate rezolva chiar și cea mai dificilă variantă a textului distorsionat cu o precizie de 99,8%. Astfel, textul distorsionat, singur, nu mai este un test de încredere.
Pentru a contracara acest lucru, anul trecut am dezvoltat un backend pentru analiza riscurilor avansate pentru reCAPTCHA care ia în considerare în mod activ întregul angajament al utilizatorului cu CAPTCHA – înainte, în timpul și după – pentru a determina dacă acel utilizator este un om. Acest lucru ne permite să ne bazăm mai puțin pe tastarea textului distorsionat și, la rândul său, să oferim o experiență mai bună utilizatorilor. Am discutat despre asta în postarea noastră de Ziua Îndrăgostiților la începutul acestui an.
Pentru mine, ideea despre „înainte, în timpul și după utilizare” este un indiciu puternic că analizează comportamentul de navigare anterior, dar interpretarea mea ar putea fi greșită.
Aici „un citat din WIRED:
În loc să depind la testul tradițional al cuvintelor distorsionate, „reCaptcha” de la Google examinează indicii pe care fiecare utilizator le oferă în mod neintenționat: adresele IP și cookie-urile oferă dovezi că utilizatorul este același om prietenos pe care Google și-l amintește din alte părți de pe web. Și Shet spune chiar și micile mișcări ale mouse-ului unui utilizator. face pe măsură ce planează și se apropie de o casetă de selectare poate ajuta la dezvăluirea unui bot automat.
Există un alt fir în stackoverflow care discută și acest lucru: https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work
În ceea ce privește verificarea imaginii, nu veți putea găsi acele imagini cu imagine inversă căutați sau compilați un baza de date a acestora. De obicei sunt indicatoare stradale aleatorii sau numere de casă capturate de mașinile Google Street View sau cuvinte din cărți scanate pentru proiectul Google Books. Există un scop bun în spatele acestui lucru – Google folosește de fapt ceea ce oamenii introduc în reCaptcha își îmbunătățesc propriile baze de date și antrenează algoritmi OCR. reCaptcha oferă aceeași imagine unui număr de utilizatori și, dacă toți sunt de acord cu ceea ce spune, atunci imaginea devine date de instruire pentru AI-ul Google.
Din Wikipedia:
Serviciul reCAPTCHA furnizează site-urilor web abonate imagini cu cuvinte pe care software-ul de recunoaștere optică a caracterelor (OCR) nu le-a putut a citi. Site-urile web care se abonează (ale căror scopuri nu sunt în general legate de proiectul de digitalizare a cărților) prezintă aceste imagini pentru ca oamenii să le descifreze ca cuvinte CAPTCHA, ca parte a procedurilor lor normale de validare. Apoi returnează rezultatele către serviciul reCAPTCHA, care trimite rezultatele către proiectele de digitalizare.
reCAPTCHA a lucrat la digitalizarea arhivelor The New York Times și a cărților de la Google Books. [3] Începând cu 2012, treizeci de ani din The New York Times fuseseră digitalizați, iar proiectul planifică să finalizeze anii rămași până la sfârșitul anului 2013. Arhiva acum completată a The New York Times poate fi căutată din New York Times Article Archive, unde au fost arhivate peste 13 milioane de articole în total, datând din 1851 până în prezent.
Comentarii
- Puteți furniza surse pentru răspunsul dvs.?
- Este posibil să aveți dreptate. M-am întrebat despre un posibil conflict cu Politica de confidențialitate , dar citind modul general în care este formulată, în special Modul în care utilizăm informațiile pe care le colectăm , pare compatibil: « Folosim informațiile pe care le colectăm de la toate serviciile noastre pentru a furniza, întreține, să le protejăm și să le îmbunătățim, să dezvoltăm altele noi și să protejăm Google și utilizatorii noștri. De asemenea, folosim aceste informații pentru a vă oferi conținut personalizat ».
- Cu toate acestea, nu vă blochează niciodată dacă ștergeți testul de imagine. (indiferent de istoria anterioară)
- Bună ziua! Am găsit acest răspuns cu adevărat interesant. Dar dacă Google este deja destul de sigur că ‘ ești un om, de ce te deranjează să afișezi un CAPTCHA?
- @EliRose O parte semnificativă a reCaptcha implementarea este o verificare de pe server a widgetului ‘ jeton de securitate . Site-ul web trebuie să verifice dacă ‘ nu este falsificat. Acest lucru se întâmplă la interacțiunea utilizatorului cu widgetul.
Răspuns
De asemenea, obișnuiesc să fiu uimit de acest lucru. Deci, ceea ce am făcut, în Chrome deschideți modul incognito, apoi navigați pe un site care are noul Google CAPTCHA și bifați caseta. Ei bine, nu m-a reușit, ci arată o serie de imagini și mi-a cerut să selectez imagini legate de o singură imagine.
Acest lucru arată că Google ne urmărește în mod constant comportamentul pentru a stabili dacă suntem oameni sau nu.
Comentarii
- Ați putea explica cum răspunde acest lucru la întrebare? Poate că ‘ îmi lipsește ceva, dar nu ‘ nu vedeți cum abordează acest lucru posibilele atacuri menționate de OP.
- @SLBarth: Se pare că oferă suport (folosind formatarea care nu ar ‘ nu s-au încadrat într-un comentariu) pentru explicația dată de răspunsul tlng05 ‘.
- @BenVoigt da, încercam doar să mă comport ca o mașină și să văd cum reacționează Google. Ștergerea cookie-urilor, a istoricului și a memoriei cache declanșează, de asemenea, același lucru.
- Presupun că sunteți în Marea Britanie.
Camion comercial ” nu înseamnă nimic pentru noi aici în SUA. Deci, și mai interesant, că Google îl face contextual din punct de vedere geografic.
- Și o notă, Chrome este și un produs Google.
Răspuns
Când faceți clic pe Eu nu sunt un robot trimite o cerere HTTP către Google cu întregul pachet de informații utile, cum ar fi
- Adresa dvs. IP
- Țara dvs.
- Timestamp
Informații din browser, cum ar fi modul în care vă deplasați cursorul chiar înainte de a intra în caseta de selectare. Cum derulați pagina înainte de clic. Intervalul de timp dintre diferite evenimente din browser și multe alte variabile pe care Google le păstrează în secret.
Toate aceste criterii sunt apoi procesate prin analiza riscurilor de învățare automată la Google și de cele mai multe ori informațiile pot face diferența dintre un om și un bot, dar dacă motorul de analiză a riscurilor este încă nesigur, atunci procentul mic de utilizatori completează adesea un provocare suplimentară.
Acolo „intervine Recunoașterea imaginii CAPTCHA . Dacă demonstrați că sunteți uman în acest fel atunci este posibil ca motorul Google să-și amintească și data viitoare după ce faceți clic pe acea casetă de selectare, veți putea trece direct cu acestea.
Răspuns
Din câte am văzut, logica este așa:
- Dacă utilizatorul nu este înregistrat în Contul Google (în browser) atunci el / el primește un captcha vizibil.
- Dacă utilizatorul este conectat la , atunci în funcție de istoricul activității dvs. anterioare (probabil în Google) ( fie pe acea pagină, fie înainte de a naviga acolo), există două scenarii posibile:
- Nu veți primi captcha
- Veți obține captcha mai ușor (adică 1 labirint în loc de 4 labirinturi)
Ceea ce nu pot să înțeleg bine este ce folosește checkbox
captchas atunci când algoritmul are a detectat deja că sunteți un om.
Comentarii
- Caseta de selectare asigură faptul că datele de mișcare ale mouse-ului trebuie înregistrate pentru a trimite captcha, printre alte lucruri
Răspuns
Face mai multe lucruri. Vă verifică adresa IP și cookie-urile. Se uită la modul în care faceți clic și cum se mișcă mouse-ul înainte de a face clic. Utilizarea unui instrument de clic automat face ca Google să vă ofere o imagine.