Bylo by velmi užitečné, kdyby Google poskytl vyhledávání regulárního výrazu .

Existuje způsob, jak to udělat?

(OBS: Nemluvím o falešných regulárních výrazech jako site:, filetype:, AND, OR nebo "Text". vyhledávejte pomocí regulárního výrazu, jako je .+[]^).

Existuje například aplikace, web nebo nástroj Google pro vyhledávání věcí jako *.stackexchange?

Odpovědět

Tato funkce není k dispozici v klasickém Vyhledávání Google a není v Cestovní mapa Google. Další informace o tomto tématu naleznete ve videu Google Implementuje Google schopnost vyhledávat pomocí regulárních výrazů?

Existují však jedna výjimka. Google Code Search podporuje regulární výrazy. Cíl vyhledávání tohoto vyhledávače témat je samozřejmě omezen pouze na zdrojový kód.

Za zmínku stojí, že některá klíčová slova pro vyhledávání Google mohou částečně nahradit regulární výrazy. Chcete-li například vyhledat libovolnou dvouslovnou variantu „search TERM“, můžete použít operátor zástupného znaku.

search * 

najde výsledky vyhledávání a jakéhokoli jiného (jednoho) slova. Často je používám ke kontrole základních anglických gramatických pravidel nebo synonym (např. „tak snadné jako *“ ).

Komentáře

Odpověď

Vyhledávání Google může vrátit shody některých jednoduchých regulárních výrazů. Například vyhledávací dotaz

"(gray|red) (wolf|fox)" 

se jeví jako ekvivalent

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox") 

Vy můžete zobrazit výstup tohoto vyhledávacího dotazu zde .

Vyhledávání Google také umožňuje " zástupný znak " znaků ve vyhledávacích řetězcích, takže můžete najít výsledky hledání pro vzory jako "the quick brown * (jumped|jumps) over the * dog" .

Komentáře

  • Hledám lék nebo chemický název. Umím přečíst " heme ?? llnate " – kde jsou otazníky nečitelné. Google nemůže ' pomoci.

Odpovědět

SymbolHound má open source vyhledávání v repozitáři kódu , podobně jako nyní ukončená možnost Vyhledávání kódu Google, kromě webového vyhledávání zahrnujícího symboly, které indexuje weby související s programováním, jako je Stackoverflow.

Komentáře

  • Pokud jste přidruženi k SymbolHound, můžete uvedete to ve svém profilu. Děkujeme!

Odpověď

Software můžete napsat na:

  1. Vezměte klíčová slova z regulárního výrazu;
  2. vyhledejte klíčová slova v Googlu a získejte seznam výsledků;
  3. procházejte každý výsledný identifikátor URI a filtrujte jej pomocí úplného regulárního výrazu.

Pojďme prostudovat případ: z site:gog.com najděte všechny hry, které mají španělský komentář.

Regulární výraz je:

Audio[^:]*:[^.,]*Spanish 

Odpovídá například:

Audio lanuage: English, German, Spanish, French. 

A neodpovídá:

Audio language: only-English. Text language: Spanish. 

Krok 1. Nechte svůj software vyhledávat na Googlu:

site:gog.com audio Spanish inurl:game 

inurl:game zde znamená pouze vyhledávání na stránkách s popisem hry

Krok 2. Získejte 300 výsledných odkazů a procházejte do všech z nich.

Krok 3. Filtrujte výsledek pomocí daného regulárního výrazu:

Audio[^:]*:[^.,]*Spanish 

Toto by mělo být snadné sestavit. Ve skutečnosti nechápu, proč nelze najít něco, co je již tímto způsobem vytvořeno.

Jelikož si vyhledávače nemohou dovolit zdroj skenovat svá data pomocí regulárního výrazu, tato špinavá práce spadá na vaši stranu a váš počítač by to měl udělat s tím, co vyhledávače již poskytují.

Komentáře

  • +1. Díky moc. Ve skutečnosti je to velmi zajímavý nápad. Hlavním problémem je, že pravděpodobně budeme potřebovat vysoce výkonné klastry, abychom mohli udělat něco opravdu zajímavého.
  • Heh, právě teď píšu toto rozšíření.

Odpověď

Ne, bohužel ne :(.Teoreticky byste si mohli vytvořit svůj vlastní vyhledávač a udělat to, ale to by bylo docela těžké.

Odpověď

Pouze pro informaci , Google pomáhá operátorům vyhledávání zde .

Je zajímavé, že „-“ je stále operátorem pro vyloučení slov, ale odstranili „+“ jako operátor, který se v minulosti používal k zadání daného hledaného výrazu. „Operátor + byl zřejmě vyřazen, když byla spuštěna služba Google+, protože + bylo zapotřebí jako znak, který lze prohledávat, nikoli jako operátor.“ ( https://support.google.com/websearch/answer/2466433 )

odpověď

Dalo by se začít s podrobným vyhledáváním Google, aby se cílový text prohledal. Poté otevřete, řekněme, 50 nejlepších výsledků na více kartách a použijte mingyi „s“ nejrychlejšího vyhledávání „Doplněk Firefoxu pro vyhledávání výsledků pomocí regulárního výrazu.

Odpověď

Google nyní podporuje a plně dokumentuje použít RegEx. Zde je odkaz pro referenci:

http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html

Komentáře

  • To ' je pouze pro Postini.

Odpověď

Pokud znáte VBA, můžete napsat nějaký kód a získat data z webu do aplikace Excel. Běhám program dnem i nocí a mohu získat miliony výsledků. Poté můžete z těchto výsledků filtrovat.

Komentáře

  • ach bože … odpusťte naše hříchy

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *