Seria muito útil se o Google fornecesse uma pesquisa de expressão regular .
Existe uma maneira de fazer isso?
(OBS: Não estou falando sobre expressões regulares falsas como site:
, filetype:
, AND
, OR
ou "Text"
. Eu gostaria de pesquise com uma expressão regular como .+[]^
).
Por exemplo, existe um aplicativo, um site ou uma ferramenta do Google para pesquisar coisas como *.stackexchange
?
Resposta
Este recurso não está disponível na Pesquisa Google clássica e” não está na Roteiro do Google. Você pode aprender mais sobre esse tópico assistindo ao vídeo do Google O Google implementará a capacidade de pesquisar com expressões regulares?
No entanto, há uma exceção. Google Code Search oferece suporte a expressões regulares. Claro, o alvo de pesquisa para este mecanismo de pesquisa de tópico é reduzido apenas ao código-fonte.
Vale a pena mencionar que algumas palavras-chave de pesquisa do Google podem substituir parcialmente expressões regulares. Por exemplo, se você deseja pesquisar qualquer variação de duas palavras de “pesquisar TERM”, pode usar o operador curinga.
search *
encontrará resultados de pesquisa e qualquer outra (uma) palavra. Costumo usá-la para verificar as regras gramaticais básicas do inglês ou sinônimos (por exemplo, “tão fácil quanto *” ).
Comentários
- Google A Pesquisa de código não existe mais , mas pode haver alternativas (não que é relevante para esta pergunta)
- Esta resposta agora está um tanto desatualizada: consulte esta resposta para ver um exemplo do Google pesquisas de expressão regular.
Resposta
A Pesquisa Google pode retornar as correspondências de algumas expressões regulares simples. Por exemplo, a consulta de pesquisa
"(gray|red) (wolf|fox)"
parece ser equivalente a
("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")
Você pode ver o resultado desta consulta de pesquisa aqui .
A Pesquisa Google também permite ” curinga ” caracteres em strings de pesquisa, para que você possa encontrar resultados de pesquisa para padrões como "the quick brown * (jumped|jumps) over the * dog"
.
Comentários
- Estou procurando um medicamento ou nome químico. Consigo ler ” heme ?? llnate ” – onde os pontos de interrogação são ilegíveis. O Google não pode ‘ ajudar.
Resposta
SymbolHound tem um código aberto pesquisa de repositório de código , semelhante à agora descontinuada opção Google Code Search, além de uma pesquisa na web com símbolo de inclusão que indexa sites relacionados à programação, como Stackoverflow.
Comentários
- Se você for afiliado da SymbolHound, pode você afirma isso em seu perfil. Obrigado!
Resposta
Você pode escrever um pedaço de software para:
- Obtenha as palavras-chave da expressão regular;
- Google as palavras-chave e obtenha uma lista de resultados;
- Rastreie cada URI resultante e filtre-o com expressão regular completa.
Vamos estudar um caso: de site:gog.com
encontre todos os jogos que tenham voz off em espanhol.
A expressão regular é:
Audio[^:]*:[^.,]*Spanish
Deve corresponder, por exemplo:
Audio lanuage: English, German, Spanish, French.
E não corresponder:
Audio language: only-English. Text language: Spanish.
Etapa 1. Deixe seu software pesquisar isso no Google:
inurl:game
aqui significa apenas pesquisar nas páginas de descrição do jogo
Etapa 2. Obtenha os 300 links resultantes e rastreie cada um deles.
Etapa 3. Filtre o resultado com a expressão regular fornecida:
Audio[^:]*:[^.,]*Spanish
Isso deve ser fácil de construir. Na verdade, eu não entendo por que não consegui encontrar algo que já foi construído dessa forma.
Uma vez que os mecanismos de pesquisa não podem pagar o recurso para verificar seus dados com expressão regular, esse trabalho sujo recai sobre você, e seu computador deve fazer isso com o que os motores de busca já oferecem.
Comentários
- +1. Muito obrigado. Esta é uma ideia muito interessante, na verdade. O principal problema é que provavelmente precisaremos de clusters de alto desempenho para fazer algo realmente interessante.
- Heh, eu ‘ estou escrevendo esta extensão agora.
Resposta
Não, infelizmente não :(.Em teoria, você poderia fazer seu próprio mecanismo de pesquisa e fazê-lo, mas isso seria muito difícil.
Resposta
Apenas para referência , A ajuda do Google sobre os operadores de pesquisa está aqui .
Curiosamente, “-” ainda é um operador para exclusão de palavras, mas eles removeram “+” como um operador, usado no passado para exigir um determinado termo de pesquisa. Aparentemente, “O operador + foi retirado quando o Google+ foi lançado, porque + era necessário como um caractere pesquisável em vez de um operador.” ( https://support.google.com/websearch/answer/2466433 )
Resposta
Você poderia começar com uma pesquisa detalhada do Google para selecionar o texto de destino a pesquisar. Em seguida, abra, digamos, os 50 principais resultados em várias guias e use mingyi “s” Pesquisa mais rápida “Firefox addon para pesquisar os resultados usando uma expressão regular.
Resposta
O Google agora oferece suporte e documenta totalmente o usar de RegEx. Aqui está o link para referência:
http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html
Comentários
- Isso ‘ s apenas para Postini.
Resposta
Se você conhece VBA, pode escrever algum código para obter dados da web para o Excel. Eu executo o programa dia e noite e posso obter milhões de resultados. Depois disso, você pode filtrar a partir desses resultados.
Comentários
- oh, Deus … perdoe nossos pecados