Det skulle vara mycket användbart om Google tillhandahöll en -regel -sökning.

Finns det något sätt att göra detta?

(OBS: Jag talar inte om falska reguljära uttryck som site:, filetype:, AND, OR eller "Text". Jag skulle vilja sök med ett reguljärt uttryck som .+[]^).

Finns det till exempel en applikation, en webbplats eller ett Google-verktyg för att söka i saker som *.stackexchange?

Svar

Den här funktionen är inte tillgänglig i klassisk Google-sökning och den finns inte i Googles färdplan. Du kan lära dig mer om detta ämne och titta på Google-videon Kommer Google att implementera möjligheten att söka med reguljära uttryck?

Det finns dock ett undantag. Google Code Search stöder regelbundna uttryck. Naturligtvis är sökmålet för sökmotorn för detta ämne endast reducerad till källkoden.

Det är värt att nämna att vissa sökord på Google delvis kan ersätta reguljära uttryck. Om du till exempel vill söka i någon två-ordsvariation av ”sök TERM” kan du använda jokerteckenoperatören.

search * 

hittar resultat för sökning och alla andra (ett) ord. Jag använder det ofta för att kontrollera grundläggande engelska grammatikregler eller synonymer (t.ex. ”lika enkelt som *” ).

Kommentarer

Svar

Google-sökning kan returnera matchningar för några enkla reguljära uttryck. Till exempel, sökfrågan

"(gray|red) (wolf|fox)" 

verkar motsvara

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox") 

Du kan se resultatet av denna sökfråga här .

Google Search tillåter också " jokertecken " tecken i söksträngar, så att du kan hitta sökresultat för mönster som "the quick brown * (jumped|jumps) over the * dog" .

Kommentarer

  • Jag letar efter ett läkemedel eller kemiskt namn. Jag kan läsa " heme ?? llnate " – där frågetecknen är oläsliga. Google kan ' t hjälp.

Svar

SymbolHound har en öppen källkod kodförrådssökning , liknar det nu avbrutna Google Code Search-alternativet, förutom en symbol-inkluderad webbsökning som indexerar programmeringsrelaterade webbplatser som Stackoverflow.

Kommentarer

  • Om du är ansluten till SymbolHound kan du du anger detta i din profil. Tack!

Svar

Du kan skriva en mjukvara till:

  1. Ta nyckelorden från det reguljära uttrycket;
  2. Sök nyckelorden och få en lista med resultat;
  3. Genomsök varje resulterande URI och filtrera den med fullständigt reguljärt uttryck.

Låt oss studera ett fall: från site:gog.com hitta alla spel som har spansk voice-over.

Regeluttrycket är:

Audio[^:]*:[^.,]*Spanish 

Det ska till exempel matcha:

Audio lanuage: English, German, Spanish, French. 

Och inte matcha:

Audio language: only-English. Text language: Spanish. 

Steg 1. Låt din programvara söka efter detta på Google:

site:gog.com audio Spanish inurl:game 

inurl:game betyder här bara att du söker på spelbeskrivningssidor

Steg 2. Få de 300 resulterande länkarna och kryp in i var och en av dem.

Steg 3. Filtrera resultatet med det givna reguljära uttrycket:

Audio[^:]*:[^.,]*Spanish 

Detta borde vara lätt att bygga. Jag förstår faktiskt inte varför jag kunde inte hitta något som redan är byggt på det sättet.

Eftersom sökmotorer inte har råd med resursen för att skanna deras data med regelbundet uttryck, faller detta smutsiga jobb från din sida och din dator borde göra det med vad sökmotorer redan tillhandahåller.

Kommentarer

  • +1. Tack så mycket. Detta är faktiskt en mycket intressant idé. Huvudproblemet är att vi förmodligen kommer att behöva högpresterande kluster för att göra något riktigt intressant.
  • Heh, jag ' jag skriver den här tillägget just nu.

Svar

Nej, tyvärr inte :(.I teorin kan du skapa din egen sökmotor och göra det, men det skulle vara ganska svårt.

Svar

Bara för referens , Googles hjälp för sökoperatörer är här .

Intressant nog är ”-” fortfarande en operatör för orduteslutning, men de tog bort ”+” som en operatör, som tidigare använts för att kräva en given sökterm. Tydligen ”+ -operatören var pensionerad när Google+ lanserades, eftersom + behövdes som ett sökbart tecken snarare än som en operatör.” ( https://support.google.com/websearch/answer/2466433 )

Svar

Du kan börja med en detaljerad Google-sökning för att få bort måltexten för att söka. Öppna sedan, säg topp 50, resulterar i flera flikar och använd mingyi ”s” snabbaste sök ”Firefox-tillägg för att söka i resultaten med ett reguljärt uttryck.

Svar

Google stöder och dokumenterar nu använda sig av från RegEx. Här är länken som referens:

http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html

Kommentarer

  • Att ' är endast för Postini.

Svar

Om du känner till VBA kan du skriva lite kod för att få data från webben till Excel. Jag kör programmet dag och natt och kan få miljontals resultat. Därefter kan du filtrera från dessa resultat.

Kommentarer

  • åh, gud … förlåt våra synder

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *