Google har gitt ut en ny form for captcha-identifikasjon av bots, som ber brukeren klikke en enkelt avkrysningsrute. Den bruker bildebasert bekreftelse bare hvis det er nødvendig.

Kan noen forklare meg hvordan et slikt program skiller et menneske fra en bot?

Det er et program her som kan utføre museklikk på datamaskinen din. Det kan ikke oppdages av et nettbasert program uten tilgang til programfilene dine. Det skal være mulig å skrive en uoppdagelig Windows-kjørbar som kan krysse av i avmerkingsboksen. Man kan også randomisere responstiden til programmet.

Etter noen få (vellykkede) forsøk vil captcha be om bildebekreftelse. Kanskje det kan løses av en AI som søker i bildene ved hjelp av Google Image Search (etter bilde), og gir gjetninger basert på filnavnene til «visuelt like» bilder. Hvis bildene som brukes ikke er fra nettet, vil de være begrenset i antall, og man kan opprette en database med dem.

Kan noen avklare om disse tilnærmingene faktisk kan fungere?

Svar

Dette er egentlig ikke et flott spørsmål for stackexchange, da Google holder algoritmene hemmelige, så alt vi virkelig kan gjøre er å gjette om hvordan det fungerer, men min forståelse er at det nye systemet vil analysere aktiviteten din på tvers av alle Googles tjenester (og muligens andre nettsteder som Google har en viss kontroll over, for eksempel nettsteder som har Google-annonser).

Dermed , er det sannsynlig at kontrollene ikke er begrenset til bare siden som har avkrysningsruten. Hvis de for eksempel oppdager at datamaskinen / IP-adressen du bruker, også tidligere ble brukt til å gjøre ting som et vanlig menneske ville gjort – ting som å sjekke Gmail, søke på Google-søk, laste opp filer til Disk, dele bilder, surfe nettet osv. – da kan det sannsynligvis være rimelig sikkert at du er et menneske og lar deg hoppe over bildebekreftelsen. På den annen side, hvis den ikke kan knytte datamaskinen din til noen tidligere menneskelignende aktivitet, ville det være mer mistenkelig og gi deg bildebekreftelsen. Selv om musens oppførsel når den klikker på avkrysningsruten, kan det være en faktor den analyserer, det er nesten helt sikkert mye mer til det.

Igjen, vi vet ikke helt hvordan det fungerer. Dette er bare mitt beste gjetning basert på det lille Google har sagt:

Mens den nye reCAPTCHA API kan høres enkel ut, ligger det en høy grad av raffinement bak den beskjedne avkrysningsruten. CAPTCHA har lenge stolt på at roboter ikke kan løse forvrengt tekst. Forskningen vår viste imidlertid nylig at dagens kunstige intelligens-teknologi kan løse selv den vanskeligste varianten av forvrengt tekst med 99,8% nøyaktighet. Således er forvrengt tekst ikke alene en pålitelig test lenger.

For å motvirke dette utviklet vi i fjor en avansert risikoanalyse-backend for reCAPTCHA som aktivt vurderer brukerens hele engasjement med CAPTCHA — før, under og etter — for å avgjøre om brukeren er et menneske. Dette gjør at vi kan stole mindre på å skrive forvrengt tekst og i sin tur tilby en bedre opplevelse for brukerne. Vi snakket om dette i Valentinsdag-innlegget vårt tidligere i år.

For meg er poenget om «før, under og etter bruk» et sterkt hint. at de analyserer tidligere surfeatferd, men tolkningen min kan være feil.

Her «et sitat fra WIRED:

I stedet for å avhenge på den tradisjonelle forvrengte ordtesten, undersøker Googles “reCaptcha” signaler hver bruker uforvarende gir: IP-adresser og informasjonskapsler gir bevis for at brukeren er den samme vennlige mennesket som Google husker andre steder på nettet. Og Shet sier til og med de små bevegelsene brukerens mus gjør når den svever og nærmer seg en avkrysningsrute kan bidra til å avsløre en automatisert bot.

Det er en annen tråd på stackoverflow som også diskuterer dette: https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work

Når det gjelder bildebekreftelse, vil du ikke kunne finne bildene med omvendt bilde søke, eller kompilere a database over dem. De er vanligvis tilfeldige gateskilt eller husnummer fanget av Googles Street View-biler, eller ord fra bøker som ble skannet for Google Books-prosjektet. Det ligger et godt formål bak dette – Google bruker faktisk det folk skriver inn i reCaptcha til forbedre sine egne databaser og trene OCR-algoritmer. reCaptcha gir det samme bildet til en rekke brukere, og hvis de alle er enige om hva det står, blir bildet treningsdata for Googles AI.

Fra wikipedia:

reCAPTCHA-tjenesten forsyner abonnerende nettsteder med bilder av ord som OCR-programvaren ikke har klart. å lese. Nettstedene som abonnerer (hvis formål generelt ikke er relatert til digitaliseringsprosjektet for boken) presenterer disse bildene for mennesker å dechiffrere som CAPTCHA-ord, som en del av deres normale valideringsprosedyrer. De returnerer deretter resultatene til reCAPTCHA-tjenesten, som sender resultatene til digitaliseringsprosjektene.

reCAPTCHA har jobbet med å digitalisere arkivene til The New York Times og bøker fra Google Books. [3] Fra og med 2012 hadde tretti år med The New York Times blitt digitalisert og prosjektet planlagt å ha fullført de resterende årene innen utgangen av 2013. Det nå fullførte arkivet til The New York Times kan søkes fra New York Times Article Archive, der mer enn 13 millioner artikler er arkivert fra 1851 til i dag.

Kommentarer

  • Kan du oppgi noen kilder for svaret ditt?
  • Du kan ha rett. Jeg lurte på en mulig konflikt med deres Personvernpolicy , men å lese den brede måten den er formulert på, og spesielt deres Hvordan vi bruker informasjon vi samler inn , virker det kompatibelt: « Vi bruker informasjonen vi samler inn fra alle våre tjenester for å levere, vedlikeholde, beskytte og forbedre dem, utvikle nye og beskytte Google og brukerne våre. Vi bruker også denne informasjonen til å tilby deg skreddersydd innhold ».
  • Det blokkerer deg imidlertid aldri hvis du sletter bildetesten. (uavhengig av tidligere historie)
  • Hei! Jeg syntes dette svaret var veldig interessant. Men hvis Google allerede er ganske sikker på at du ‘ er menneske, hvorfor gidder det i det hele tatt å vise en CAPTCHA?
  • @EliRose En betydelig del av reCaptcha implementering er en server-sjekk av widgeten ‘ s sikkerhetstoken . Nettstedet må bekrefte at det ‘ ikke blir spoofet. Dette skjer ved brukerinteraksjon med widgeten.

Svar

Jeg pleier også å bli overrasket over denne tingen. Så hva jeg gjorde, i Chrome åpen inkognitomodus, bla gjennom et nettsted som har den nye Google CAPTCHA og kryss av i boksen. Det kom meg ikke igjennom, i stedet viser det en serie bilder og ba meg om å velge bilder relatert til ett bilde.

Dette viser at Google hele tiden sporer oppførselen vår for å avgjøre om vi er mennesker. eller ikke.

Inkognitomodus

Kommentarer

  • Kan du forklare hvordan dette svarer på spørsmålet? Kanskje jeg ‘ mangler noe, men jeg savner ‘ t se hvordan dette adresserer mulige angrep som OP nevner.
  • @SLBarth: Det ser ut til å gi støtte (ved hjelp av formatering som ikke ville ‘ t har passet inn i en kommentar) for forklaringen gitt av tlng05 ‘ s svar.
  • @BenVoigt ja jeg prøvde bare å oppføre meg som en maskin og se hvordan Google reagerer. Slette informasjonskapsler, historikk og hurtigbuffer utløser også det samme.
  • Jeg ‘ Jeg gjetter at du er i Storbritannia.

    Kommersiell lastebil » betyr ingenting for oss her i USA. Så enda mer interessant at google gjør det geografisk kontekstuelt.

  • Og et notat, Chrome er også et produkt av Google.

Svar

Når du klikker på Jeg er ikke en robot den sender en HTTP-forespørsel til google med hele mengden nyttig informasjon som

  • IP-adressen din
  • Landet ditt
  • Tidsstempel

Informasjon fra nettleseren din, for eksempel måten du beveger markøren rett før du går inn i avmerkingsboksen. Hvordan du blar gjennom siden før klikket. Tidsintervallet mellom forskjellige nettleserhendelser og mange andre variabler som google holder hemmelig.

Alle disse kriteriene blir deretter behandlet av maskinlæringsrisikoanalyse hos Google, og mesteparten av tiden kan informasjonen fortelle forskjellen mellom et menneske og en bot, men Hvis risikoanalysemotoren fremdeles er usikker, fullfører den lille prosentandelen ofte en ekstra utfordring.

Det er der Bildegjenkjenning CAPTCHA kommer inn. Hvis du beviser at du er menneske på denne måten så er sjansen stor for at Googles motor vil huske, og neste gang etter å ha klikket på den avkrysningsruten, vil du kunne gå rett gjennom med disse.

Svar

Så vidt jeg har sett, er logikken slik:

  • Hvis brukeren ikke er logget i Google-kontoen (i nettleseren), får han / hun en synlig captcha.
  • Hvis brukeren er logget inn , avhengig av din forrige (sannsynligvis over hele google) aktivitetsloggen ( enten på den siden eller før du navigerte dit), er det to mulige scenarier:
    1. Du får ingen captcha
    2. Du får lettere captcha (dvs. 1 labyrint i stedet for 4 labyrinter)

Det jeg ikke kan forstå godt, er hva som er bruk av checkbox captchas når algoritmen har allerede oppdaget at du er menneske.

Kommentarer

  • Avkrysningsruten sørger for at musebevegelsesdata må registreres for å kunne sende captcha, blant andre ting

Svar

Det gjør flere ting. Den sjekker IP-adressen din og informasjonskapsler. Det ser på hvordan du klikker og musen beveger seg før du klikker. Bruk av et automatisk klikkverktøy gjør at Google gir deg en bildesak.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *