Google은 사용자에게 단일 체크 박스를 클릭하도록 요청하는 새로운 형태의 봇 보안 문자 식별을 출시했습니다. 필요한 경우에만 이미지 기반 검증을 사용합니다.

누군가 이러한 프로그램이 인간과 봇을 어떻게 구별하는지 설명해 주시겠습니까?

프로그램이 있습니다. 여기 . 프로그램 파일에 대한 액세스 권한이없는 웹 기반 프로그램에서는 감지 할 수 없습니다. 확인란을 선택할 수있는 감지 할 수없는 Windows 실행 파일을 작성할 수 있어야합니다. 프로그램의 응답 시간을 무작위로 지정할 수도 있습니다.

몇 번 (성공적인) 시도 후에 보안 문자가 이미지 확인을 요청합니다. Google 이미지 검색 (이미지 기준)을 사용하여 이미지를 검색하고 “시각적으로 유사한”이미지의 파일 이름을 기반으로 추측하는 AI로 해결할 수 있습니다. 사용 된 이미지가 인터넷에서 가져온 것이 아니라면 개수가 제한되어 데이터베이스를 만들 수 있습니다.

누군가 이러한 접근 방식이 실제로 작동 할 수 있는지 명확히 할 수 있습니까?

답변

Google이 알고리즘을 비밀로 유지하고 있기 때문에 stackexchange에 대한 좋은 질문은 아닙니다. 하지만 내 이해는 새 시스템이 모든 Google 서비스 (및 Google 광고가있는 웹 사이트와 같이 Google이 일부 제어 할 수있는 다른 사이트)에서 귀하의 활동을 분석한다는 것입니다.

따라서 , 체크가 체크 박스가있는 페이지에만 국한되지 않을 수 있습니다. 예를 들어, 사용자가 사용중인 컴퓨터 / IP 주소가 과거에 일반 사람이 할 수있는 작업 (예 : Gmail 확인, Google 검색 검색, 드라이브에 파일 업로드, 사진 공유, 탐색 등)에 사용 된 것을 감지 한 경우 웹 등-그러면 당신이 사람이라는 것을 합리적으로 확신 할 수 있고 이미지 확인을 건너 뛸 수 있습니다. 반면에 컴퓨터를 이전의 인간과 유사한 활동과 연관시킬 수없는 경우에는 더 의심스럽고 이미지 확인을 제공합니다. 확인란을 클릭 할 때의 마우스 동작이 분석하는 한 가지 요인 일 수 있지만 확실히 더 많은 것이 있습니다.

다시 말하지만, 우리는 그것이 어떻게 작동하는지 확실하지 않습니다. 이것은 Google이 거의 말한 내용을 기반으로 한 내 최선의 추측입니다.

새로운 reCAPTCHA API는 간단하게 들릴 수 있지만 그 뒤에는 고도의 정교함이 있습니다. 그 겸손한 확인란. CAPTCHA는 오랫동안 로봇이 왜곡 된 텍스트를 해결할 수 없다는 데 의존해 왔습니다. 그러나 최근 연구에 따르면 오늘날의 인공 지능 기술은 가장 어려운 왜곡 된 텍스트 변형도 99.8 % 정확도로 해결할 수 있습니다. 따라서 왜곡 된 텍스트 자체는 더 이상 신뢰할 수있는 테스트가 아닙니다.

이에 대응하기 위해 작년에 우리는 사용자의 CAPTCHA 사용 전체를 적극적으로 고려하는 reCAPTCHA 용 고급 위험 분석 백엔드를 개발했습니다. 그 사용자가 인간인지 확인하기 위해 이를 통해 왜곡 된 텍스트 입력에 의존하지 않고 사용자에게 더 나은 경험을 제공 할 수 있습니다. 올해 초 발렌타인 데이 게시물에서 이에 대해 이야기했습니다.

“사용 전, 사용 중, 사용 후”에 대한 요점은 강력한 힌트입니다. 이전 브라우징 동작을 분석하지만 제 해석이 틀릴 수 있습니다.

다음은 WIRED의 인용문입니다.

기존의 왜곡 된 단어 테스트에서 Google의 “reCaptcha”는 모든 사용자가 무의식적으로 제공하는 단서를 조사합니다. IP 주소와 쿠키는 사용자가 Google이 웹의 다른 곳에서 기억하는 친숙한 인간과 동일하다는 증거를 제공합니다. 그리고 Shet은 사용자의 마우스가 작은 움직임조차도 말합니다. 마우스를 움직이고 접근 할 때 확인란을 선택하면 자동화 된 봇을 표시하는 데 도움이 될 수 있습니다.

이에 대해 논의하는 또 다른 스레드가 stackoverflow에 있습니다. https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work

이미지 확인의 경우 이미지가 반전 된 이미지를 찾을 수 없습니다. 검색 또는 컴파일 그들의 데이터베이스. 일반적으로 Google의 스트리트 뷰 차량에서 캡처 한 임의의 도로 표지판이나 집 번호 또는 Google 도서 프로젝트를 위해 스캔 한 책의 단어입니다.이 뒤에 좋은 목적이 있습니다. Google은 실제로 사람들이 reCaptcha에 입력 한 내용을 사용하여 자신의 데이터베이스를 개선하고 OCR 알고리즘을 훈련시킵니다. reCaptcha는 여러 사용자에게 동일한 이미지를 제공하며, 모두가 말한 내용에 동의하면 사진이 Google AI의 훈련 데이터가됩니다.

wikipedia에서 :

reCAPTCHA 서비스는 OCR (Optical Character Recognition) 소프트웨어에서 제공 할 수없는 단어 이미지를 구독 웹 사이트에 제공합니다. 읽다. 구독하는 웹 사이트 (일반적으로 도서 디지털화 프로젝트와 관련이없는 목적)는 정상적인 유효성 검사 절차의 일부로 사람이 CAPTCHA 단어로 해독 할 수 있도록 이러한 이미지를 제공합니다. 그런 다음 결과를 reCAPTCHA 서비스에 반환하여 결과를 디지털화 프로젝트로 보냅니다.

reCAPTCHA는 The New York Times의 아카이브와 Google 도서의 도서를 디지털화하는 작업을 수행했습니다. [3] 2012 년 현재, The New York Times의 30 년이 디지털화되었으며 프로젝트는 2013 년 말까지 남은 연도를 완료 할 계획입니다. 현재 완성 된 The New York Times의 아카이브는 New York Times 기사 아카이브에서 검색 할 수 있습니다. 1851 년부터 현재까지 총 1,300 만 개 이상의 기사가 보관되었습니다.

댓글

  • 답변에 대한 출처를 제공 할 수 있습니까?
  • 당신이 맞을 수 있습니다. 나는 그들의 개인 정보 보호 정책 과의 충돌 가능성에 대해 궁금해했지만 그것이 공식화 된 광범위한 방식, 특히 수집 한 정보를 사용하는 방법 , 호환되는 것 같습니다. « 우리는 모든 서비스에서 수집 한 정보를 사용하여 제공, 유지, 보호하고 개선하고, 새로운 것을 개발하고, Google과 사용자를 보호합니다. 또한이 정보를 사용하여 맞춤형 콘텐츠를 제공합니다 ».
  • 그러나 이미지 테스트를 삭제해도 차단되지 않습니다. (이전 기록과 무관)
  • 안녕하세요! 이 답변이 정말 흥미로 웠습니다. 하지만 Google이 이미 귀하가 ' 사람이라고 확신한다면 왜 CAPTCHA를 표시해야하나요?
  • @EliRose reCaptcha의 중요한 부분 구현은 위젯 ' 보안 토큰 의 서버 측 확인입니다. 웹 사이트는 스푸핑되지 않았는지 ' 확인해야합니다. 이것은 사용자가 위젯과 상호 작용할 때 발생합니다.

답변

저도이 일에 놀랐습니다. 그래서 내가 한 일은 Chrome에서 시크릿 모드를 연 다음 새로운 Google 보안 문자가있는 사이트를 탐색하고 상자를 선택했습니다. 글쎄, 그것은 나를 이해하지 못했습니다. 대신 일련의 이미지를 보여주고 하나의 이미지와 관련된 이미지를 선택하도록 요청했습니다.

이것은 Google이 우리가 인간인지 확인하기 위해 우리의 행동을 지속적으로 추적하고 있음을 보여줍니다.

시크릿 모드

댓글

  • 이 질문에 대한 답을 설명해 주시겠습니까? ' 뭔가 빠졌지 만 ' OP에서 언급 한 가능한 공격을 어떻게 해결하는지 알 수 없습니다.
  • @SLBarth : 지원을 제공하는 것 같습니다 (' 주석에 적합하지 않음) tlng05 '의 답변에 대한 설명.
  • @BenVoigt 예 저는 기계처럼 행동하고 Google의 반응입니다. 쿠키, 기록 및 캐시를 삭제해도 동일한 작업이 실행됩니다.
  • 저는 ' 당신이 영국에있는 것 같습니다.

    상업용 트럭 "은 여기 미국에서 우리에게 아무 의미가 없습니다. 훨씬 더 흥미로워 서 Google이 지리적으로 맥락을 파악하고 있습니다.

  • 참고로, Chrome 또한 Google 제품입니다.

답변

나는 로봇이 아닙니다. HTTP 요청을 통해 Google에

  • 귀하의 IP 주소
  • 귀하의 국가
  • 타임 스탬프

확인란을 입력하기 직전에 커서를 이동하는 방식과 같은 브라우저의 정보. 클릭하기 전에 페이지를 스크롤하는 방식. 사이의 시간 간격 Google이 비밀로 유지하는 다양한 브라우저 이벤트 및 기타 여러 변수.

이러한 모든 기준은 Google의 기계 학습 위험 분석에 의해 처리되며 대부분의 경우 정보는 사람과 봇의 차이를 알 수 있지만 위험 분석 엔진이 여전히 확실하지 않은 경우 소수의 사용자가 종종 추가 도전.

여기서 이미지 인식 CAPTCHA 가 등장합니다.이 방법으로 인간임을 증명하는 경우 그런 다음 Google 엔진이 기억할 가능성이 있으며 다음에 해당 확인란을 클릭 한 후 바로 통과 할 수 있습니다.

답변

내가 본 논리는 다음과 같습니다.

  • 사용자가 Google 계정 (브라우저에서)에 로그인되지 않은 경우 사용자는 눈에 보이는 보안 문자를받습니다.
  • 사용자가 로그인되어있는 경우 , 이전 (아마도 Google 전체) 활동 기록 ( 해당 페이지에서 또는 탐색하기 전에) 두 가지 가능한 시나리오가 있습니다.
    1. 보안 문자가 표시되지 않습니다
    2. 보안 문자가 더 쉬워집니다 (예 : 미로 4 개 대신 미로 1 개).

잘 이해할 수없는 것은 알고리즘이 다음과 같은 경우 checkbox 캡차를 사용하는 것입니다. 이미 사람임을 감지했습니다.

댓글

  • 체크 박스는 보안 문자를 제출하기 위해 마우스 움직임 데이터를 기록해야합니다. 기타

답변

여러 가지 기능을합니다. 귀하의 IP 주소와 쿠키를 확인합니다. 클릭하기 전에 클릭하고 마우스가 움직이는 방식을 확인합니다. 자동 클릭 도구를 사용하면 Google에서 사진을 제공합니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다