Google이 정규식 검색을 제공했다면 매우 유용 할 것입니다.
이 작업을 수행 할 수있는 방법이 있습니까?
(OBS : site:
, , AND
, OR
또는 "Text"
. .+[]^
와 같은 정규 표현식으로 검색).
예를 들어 ?
답변
이 기능은 기본 Google 검색에서 사용할 수 없으며 Google의 로드맵. 이 주제에 대한 자세한 내용은 Google 비디오 Google에서 정규 표현식으로 검색하는 기능을 구현합니까?
하지만 한 가지 예외입니다. Google 코드 검색 은 정규 표현식을 지원합니다. 물론이 주제 검색 엔진의 검색 대상은 소스 코드로만 축소됩니다.
일부 Google 검색 키워드는 정규 표현식을 부분적으로 대체 할 수 있습니다. 예를 들어 “검색 TERM”의 두 단어 변형을 검색하려면 와일드 카드 연산자를 사용할 수 있습니다.
search *
검색 및 기타 (한) 단어에 대한 결과를 찾습니다. 기본 영문법 규칙이나 동의어를 확인하는 데 자주 사용합니다 (예 : “as easy as *”).
댓글
- Google 코드 검색은 더 이상 존재하지 않지만 대안이있을 수 있습니다 (이 질문과 관련이 있음)
- 이 답변은 현재 다소 구식입니다. Google의 예는 이 답변 을 참조하세요. 정규식 검색.
답변
Google 검색은 몇 가지 간단한 정규식과 일치하는 결과를 반환 할 수 있습니다. 예를 들어, 검색어
"(gray|red) (wolf|fox)"
는
("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")
귀하 이 검색어의 출력은 여기 에서 볼 수 있습니다.
Google 검색에서는 " 와일드 카드도 허용합니다. 검색 문자열에 " 문자가 있으므로 "the quick brown * (jumped|jumps) over the * dog"
와 같은 패턴에 대한 검색 결과를 찾을 수 있습니다. .
댓글
- 약이나 화학 물질 이름을 찾고 있습니다. " heme ?? llnate "를 읽을 수 있습니다. 여기서 물음표를 읽을 수 없습니다. Google은 ' 도움이되지 않습니다.
답변
SymbolHound 에는 현재 중단 된 Google 코드 검색 옵션과 유사한 오픈 소스 코드 저장소 검색 이 있습니다. Stackoverflow와 같은 프로그래밍 관련 사이트를 색인화하는 기호 포함 웹 검색 외에도.
댓글
- SymbolHound와 제휴 한 경우 다음 작업을 수행 할 수 있습니다. 당신은 이것을 당신의 프로필에 명시합니다. 감사합니다!
답변
다음에 소프트웨어를 작성할 수 있습니다.
- 정규 표현식에서 키워드를 가져옵니다.
- Google에서 키워드를 검색하고 결과 목록을 가져옵니다.
- 각 결과 URI를 크롤링하고 완전한 정규 표현식으로 필터링합니다.
사례를 살펴 보겠습니다. site:gog.com
에서 스페인어 음성 해설이있는 모든 게임을 찾습니다.
정규 표현식은 다음과 같습니다.
Audio[^:]*:[^.,]*Spanish
예 :
Audio lanuage: English, German, Spanish, French.
일치하지 않음 :
Audio language: only-English. Text language: Spanish.
1 단계. 소프트웨어가 Google에서이를 검색하도록합니다.
site:gog.com audio Spanish inurl:game
inurl:game
는 게임 설명 페이지에서만 검색한다는 의미입니다.
2 단계. 300 개의 결과 링크를 가져 와서 모든 링크를 크롤링합니다.
3 단계. 주어진 정규 표현식으로 결과를 필터링합니다.
Audio[^:]*:[^.,]*Spanish
이것은 쉽게 만들 수 있습니다. 사실 나는 왜 내가 이미 그런 방식으로 구축 된 것을 찾을 수 없습니다.
검색 엔진은 정규식으로 데이터를 스캔 할 리소스를 감당할 수 없기 때문에이 더러운 작업은 사용자의 책임이며 컴퓨터는이를 수행해야합니다. 검색 엔진이 이미 제공하는 것입니다.
댓글
- +1. 정말 고마워. 사실 이것은 매우 흥미로운 아이디어입니다. 주된 문제는 정말 흥미로운 작업을 수행하려면 고성능 클러스터가 필요할 것입니다.
- 저는 ' 지금이 확장 프로그램을 작성하고 있습니다.
답변
아니요, 안타깝게도 :(.이론적으로는 자신 만의 검색 엔진을 만들어 수행 할 수 있지만 이는 매우 어려울 것입니다.
답변
참조 용입니다. , 검색 연산자에 대한 Google의 도움말은 여기 입니다.
흥미롭게도 “-“는 여전히 단어 제외 연산자이지만 제거되었습니다. “+”는 연산자로, 과거에는 특정 검색어를 요구하기 위해 사용되었습니다. “+는 연산자가 아닌 검색 가능한 문자로 필요했기 때문에 + 연산자는 Google+가 출시 될 때 사용 중지되었습니다.”( https://support.google.com/websearch/answer/2466433 )
답변
상세한 Google 검색으로 시작하여 검색 할 대상 텍스트를 추출 할 수 있습니다. 그런 다음 상위 50 개 결과를 여러 탭에서 열고 mingyi “의”Fastest Search “Firefox 애드온 은 정규 표현식을 사용하여 결과를 검색합니다.
답변
이제 Google은 사용하다 RegEx의. 다음은 참조 용 링크입니다.
http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html
댓글
- '는 Postini에만 해당됩니다.
답변
VBA를 알고 있다면 웹에서 Excel로 데이터를 가져 오는 코드를 작성할 수 있습니다. 프로그램을 밤낮으로 실행하고 수백만 개의 결과를 얻을 수 있습니다. 그런 다음 해당 결과에서 필터링 할 수 있습니다.
댓글
- 오, 하느님 … 우리 죄를 용서하세요