Google이 정규식 검색을 제공했다면 매우 유용 할 것입니다.

이 작업을 수행 할 수있는 방법이 있습니까?

(OBS : site:, , AND, OR 또는 "Text". .+[]^와 같은 정규 표현식으로 검색).

예를 들어 ?

답변

이 기능은 기본 Google 검색에서 사용할 수 없으며 Google의 로드맵. 이 주제에 대한 자세한 내용은 Google 비디오 Google에서 정규 표현식으로 검색하는 기능을 구현합니까?

하지만 한 가지 예외입니다. Google 코드 검색 은 정규 표현식을 지원합니다. 물론이 주제 검색 엔진의 검색 대상은 소스 코드로만 축소됩니다.

일부 Google 검색 키워드는 정규 표현식을 부분적으로 대체 할 수 있습니다. 예를 들어 “검색 TERM”의 두 단어 변형을 검색하려면 와일드 카드 연산자를 사용할 수 있습니다.

search * 

검색 및 기타 (한) 단어에 대한 결과를 찾습니다. 기본 영문법 규칙이나 동의어를 확인하는 데 자주 사용합니다 (예 : “as easy as *”).

댓글

답변

Google 검색은 몇 가지 간단한 정규식과 일치하는 결과를 반환 할 수 있습니다. 예를 들어, 검색어

"(gray|red) (wolf|fox)" 

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox") 

귀하 이 검색어의 출력은 여기 에서 볼 수 있습니다.

Google 검색에서는 " 와일드 카드도 허용합니다. 검색 문자열에 " 문자가 있으므로 "the quick brown * (jumped|jumps) over the * dog"와 같은 패턴에 대한 검색 결과를 찾을 수 있습니다. .

댓글

  • 약이나 화학 물질 이름을 찾고 있습니다. " heme ?? llnate "를 읽을 수 있습니다. 여기서 물음표를 읽을 수 없습니다. Google은 ' 도움이되지 않습니다.

답변

SymbolHound 에는 현재 중단 된 Google 코드 검색 옵션과 유사한 오픈 소스 코드 저장소 검색 이 있습니다. Stackoverflow와 같은 프로그래밍 관련 사이트를 색인화하는 기호 포함 웹 검색 외에도.

댓글

  • SymbolHound와 제휴 한 경우 다음 작업을 수행 할 수 있습니다. 당신은 이것을 당신의 프로필에 명시합니다. 감사합니다!

답변

다음에 소프트웨어를 작성할 수 있습니다.

  1. 정규 표현식에서 키워드를 가져옵니다.
  2. Google에서 키워드를 검색하고 결과 목록을 가져옵니다.
  3. 각 결과 URI를 크롤링하고 완전한 정규 표현식으로 필터링합니다.

사례를 살펴 보겠습니다. site:gog.com에서 스페인어 음성 해설이있는 모든 게임을 찾습니다.

정규 표현식은 다음과 같습니다.

Audio[^:]*:[^.,]*Spanish 

예 :

Audio lanuage: English, German, Spanish, French. 

일치하지 않음 :

Audio language: only-English. Text language: Spanish. 

1 단계. 소프트웨어가 Google에서이를 검색하도록합니다.

site:gog.com audio Spanish inurl:game 

inurl:game는 게임 설명 페이지에서만 검색한다는 의미입니다.

2 단계. 300 개의 결과 링크를 가져 와서 모든 링크를 크롤링합니다.

3 단계. 주어진 정규 표현식으로 결과를 필터링합니다.

Audio[^:]*:[^.,]*Spanish 

이것은 쉽게 만들 수 있습니다. 사실 나는 왜 내가 이미 그런 방식으로 구축 된 것을 찾을 수 없습니다.

검색 엔진은 정규식으로 데이터를 스캔 할 리소스를 감당할 수 없기 때문에이 더러운 작업은 사용자의 책임이며 컴퓨터는이를 수행해야합니다. 검색 엔진이 이미 제공하는 것입니다.

댓글

  • +1. 정말 고마워. 사실 이것은 매우 흥미로운 아이디어입니다. 주된 문제는 정말 흥미로운 작업을 수행하려면 고성능 클러스터가 필요할 것입니다.
  • 저는 ' 지금이 확장 프로그램을 작성하고 있습니다.

답변

아니요, 안타깝게도 :(.이론적으로는 자신 만의 검색 엔진을 만들어 수행 할 수 있지만 이는 매우 어려울 것입니다.

답변

참조 용입니다. , 검색 연산자에 대한 Google의 도움말은 여기 입니다.

흥미롭게도 “-“는 여전히 단어 제외 연산자이지만 제거되었습니다. “+”는 연산자로, 과거에는 특정 검색어를 요구하기 위해 사용되었습니다. “+는 연산자가 아닌 검색 가능한 문자로 필요했기 때문에 + 연산자는 Google+가 출시 될 때 사용 중지되었습니다.”( https://support.google.com/websearch/answer/2466433 )

답변

상세한 Google 검색으로 시작하여 검색 할 대상 텍스트를 추출 할 수 있습니다. 그런 다음 상위 50 개 결과를 여러 탭에서 열고 mingyi “의”Fastest Search “Firefox 애드온 은 정규 표현식을 사용하여 결과를 검색합니다.

답변

이제 Google은 사용하다 RegEx의. 다음은 참조 용 링크입니다.

http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html

댓글

  • '는 Postini에만 해당됩니다.

답변

VBA를 알고 있다면 웹에서 Excel로 데이터를 가져 오는 코드를 작성할 수 있습니다. 프로그램을 밤낮으로 실행하고 수백만 개의 결과를 얻을 수 있습니다. 그런 다음 해당 결과에서 필터링 할 수 있습니다.

댓글

  • 오, 하느님 … 우리 죄를 용서하세요

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다