Het zou erg handig zijn als Google een reguliere expressie -zoekopdracht zou leveren.

Is er een manier om dit te doen?

(OBS: ik heb het niet over valse reguliere expressies zoals site:, filetype:, AND, OR of "Text". Ik wil graag zoek met een reguliere expressie zoals .+[]^).

Is er bijvoorbeeld een applicatie, een site of een Google-tool om dingen te doorzoeken als *.stackexchange?

Answer

Deze functie is niet beschikbaar in de klassieke Google Zoeken en staat ook niet in Googles roadmap. U kunt meer over dit onderwerp leren door de Google-video te bekijken Zal Google de mogelijkheid implementeren om te zoeken met reguliere expressies?

Er is echter een één uitzondering. Google Code Search ondersteunt reguliere expressies. Uiteraard wordt het zoekdoel voor deze onderwerpzoekmachine gereduceerd tot alleen de broncode.

Het is de moeite waard te vermelden dat sommige Google-zoektermen reguliere expressies gedeeltelijk kunnen vervangen. Als u bijvoorbeeld een variant van twee woorden van “zoekterm” wilt zoeken, kunt u de jokertekenoperator gebruiken.

search * 

vindt resultaten voor zoeken en elk ander (één) woord. Ik gebruik het vaak om de Engelse grammaticaregels of synoniemen te controleren (bijv. “as easy as *” ).

Reacties

Answer

Google Zoeken kan de overeenkomsten van enkele eenvoudige reguliere expressies retourneren. De zoekopdracht

"(gray|red) (wolf|fox)" 

lijkt bijvoorbeeld equivalent te zijn aan

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox") 

kan de uitvoer van deze zoekopdracht hier zien.

Google Zoeken staat ook ” wildcard toe ” tekens in zoekstrings, zodat u zoekresultaten kunt vinden voor patronen zoals "the quick brown * (jumped|jumps) over the * dog" .

Opmerkingen

  • Ik zoek naar een medicijnnaam of een chemische naam. Ik kan ” heem ?? llnate ” lezen – waar de vraagtekens onleesbaar zijn. Google kan ‘ niet helpen.

Antwoord

SymbolHound heeft een open source coderepository-zoekopdracht , vergelijkbaar met de nu beëindigde Google Code Search-optie, naast een webzoekopdracht die symbolen omvat die programmeergerelateerde sites zoals Stackoverflow indexeert.

Opmerkingen

  • Als u bij SymbolHound bent aangesloten, kunt u dat dit vermeld je in je profiel. Bedankt!

Antwoord

U kunt een stukje software schrijven naar:

  1. Neem de trefwoorden uit de reguliere expressie;
  2. Google de trefwoorden en krijg een lijst met resultaten;
  3. Crawl elke resulterende URI en filter deze met volledige reguliere expressie.

Laten we eens kijken naar een casus: van site:gog.com vind je alle games met Spaanse voice-over.

De reguliere expressie is:

Audio[^:]*:[^.,]*Spanish 

Het zal bijvoorbeeld overeenkomen met:

Audio lanuage: English, German, Spanish, French. 

En niet overeenkomen met:

Audio language: only-English. Text language: Spanish. 

Stap 1. Laat uw software dit zoeken op Google:

site:gog.com audio Spanish inurl:game 

inurl:game betekent hier alleen zoeken in spelbeschrijvingspaginas.

Stap 2. Verkrijg de 300 resulterende links en kruip in elk ervan.

Stap 3. Filter het resultaat met de gegeven reguliere expressie:

Audio[^:]*:[^.,]*Spanish 

Dit zou gemakkelijk te bouwen moeten zijn. In feite begrijp ik niet waarom ik kon niet iets vinden dat al op die manier is gebouwd.

Aangezien zoekmachines de bron niet kunnen veroorloven om hun gegevens met reguliere expressie te scannen, valt dit smerige werk van uw kant, en uw computer zou dat moeten doen met wat zoekmachines al bieden.

Reacties

  • +1. Heel erg bedankt. Dit is in feite een heel interessant idee. Het grootste probleem is dat we waarschijnlijk krachtige clusters nodig hebben om iets echt interessants te doen.
  • Heh, ik ‘ ben deze extensie nu aan het schrijven.

Antwoord

Nee, helaas niet :(.In theorie zou je je eigen zoekmachine kunnen maken en het doen, maar dat zou best moeilijk zijn.

Antwoord

Alleen ter referentie Is de hulp van Google voor zoekoperatoren hier .

Interessant genoeg is “-” nog steeds een operator voor woorduitsluiting, maar ze hebben verwijderd “+” als operator, die in het verleden werd gebruikt om een bepaalde zoekterm te vereisen. Blijkbaar “is de operator + gestopt toen Google+ werd gelanceerd, omdat + nodig was als doorzoekbaar teken in plaats van als operator.” ( https://support.google.com/websearch/answer/2466433 )

Antwoord

Je zou kunnen beginnen met een gedetailleerde Google-zoekopdracht om de doeltekst te wissen die je wilt doorzoeken. Open vervolgens bijvoorbeeld de top 50 resultaten in meerdere tabbladen en gebruik mingyi “s” Snelste zoekopdracht “Firefox-add-on om de resultaten te zoeken met behulp van een reguliere expressie.

Antwoord

Google ondersteunt nu en documenteert de gebruik van RegEx. Hier is de link ter referentie:

http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html

Reacties

  • Dat ‘ is alleen voor Postini.

Antwoord

Als u VBA kent, kunt u wat code schrijven om gegevens van het web naar Excel te krijgen. Ik voer het programma dag en nacht uit en kan miljoenen resultaten behalen. Daarna kun je uit die resultaten filteren.

Reacties

  • oh, god … vergeef onze zonden

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *