Ar fi foarte util dacă Google ar furniza o căutare expresie regulată .

Există o modalitate de a face acest lucru?

(OBS: Nu vorbesc despre expresii regulate false precum site:, filetype:, AND, OR sau "Text". Aș dori să căutați cu o expresie regulată precum .+[]^).

De exemplu, există o aplicație, un site sau un instrument Google pentru a căuta lucruri precum *.stackexchange?

Răspuns

Această caracteristică nu este disponibilă în Căutarea Google clasică și nu este în Foaia de parcurs Google. Puteți afla mai multe despre acest subiect vizionând videoclipul Google Va implementa Google posibilitatea de a căuta cu expresii regulate?

Cu toate acestea, există o excepție. Căutare cod Google acceptă expresii regulate. Desigur, ținta de căutare pentru acest motor de căutare subiect este redusă doar la cod sursă.

Merită menționat faptul că unele cuvinte cheie de căutare Google pot înlocui parțial expresiile regulate. De exemplu, dacă doriți să căutați orice variantă de două cuvinte a „TERMENULUI de căutare”, puteți utiliza operatorul cu metacaracter.

search * 

va găsi rezultate pentru căutare și orice alt (un) cuvânt. De multe ori îl folosesc pentru a verifica regulile gramaticale de bază în engleză sau sinonimele (de exemplu, „la fel de ușor ca *” ).

Comentarii

Răspuns

Căutarea Google poate returna potrivirile unor expresii regulate simple. De exemplu, interogarea de căutare

"(gray|red) (wolf|fox)" 

pare a fi echivalentă cu

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox") 

poate vedea rezultatul acestei interogări de căutare aici .

Căutarea Google permite, de asemenea, ” wildcard ” caractere în șirurile de căutare, astfel încât să puteți găsi rezultate de căutare pentru modele precum "the quick brown * (jumped|jumps) over the * dog" .

Comentarii

  • Caut un medicament sau un nume chimic. Pot citi ” heme ?? llnate ” – unde semnele de întrebare sunt ilizibile. Google nu vă poate ajuta ‘.

Răspunde

SymbolHound are o sursă deschisă căutare în depozit de cod , similar cu opțiunea de căutare Google Code care nu mai este disponibilă, pe lângă o căutare web care include simboluri, care indexează site-urile legate de programare, cum ar fi Stackoverflow.

Comentarii

  • Dacă sunteți afiliat cu SymbolHound, vă rugăm să puteți afirmați acest lucru în profilul dvs. Mulțumesc!

Răspuns

Puteți scrie un software la:

  1. Luați cuvintele cheie din expresia regulată;
  2. Google cuvintele cheie și obțineți o listă de rezultate;
  3. Accesați cu crawlere fiecare URI rezultat și filtrați-l cu expresie regulată completă.

Să studiem un caz: din site:gog.com găsim toate jocurile care au voce în spaniolă.

Expresia regulată este:

Audio[^:]*:[^.,]*Spanish 

Va coincide, de exemplu:

Audio lanuage: English, German, Spanish, French. 

Și nu se potrivește:

Audio language: only-English. Text language: Spanish. 

Pasul 1. Permiteți software-ului dvs. să caute acest lucru pe Google:

site:gog.com audio Spanish inurl:game 

inurl:game aici înseamnă căutare numai în paginile de descriere a jocului

Pasul 2. Obțineți cele 300 de linkuri rezultate și accesați cu crawlere fiecare dintre ele.

Pasul 3. Filtrați rezultatul cu expresia regulată dată:

Audio[^:]*:[^.,]*Spanish 

Acest lucru ar trebui să fie ușor de construit. De fapt, nu înțeleg de ce nu s-a putut găsi ceva care este deja construit în acest fel.

Deoarece motoarele de căutare nu își pot permite resursa de a scana datele cu expresie regulată, această sarcină murdară revine dvs., iar computerul dvs. ar trebui să facă asta cu ceea ce furnizează deja motoarele de căutare.

Comentarii

  • +1. Mulțumesc mult. De fapt, aceasta este o idee foarte interesantă. Principala problemă este că probabil vom avea nevoie de clustere de înaltă performanță pentru a face ceva cu adevărat interesant.
  • Heh, eu ‘ m scriu această extensie chiar acum.

Răspuns

Nu, din păcate nu :(.În teorie, ai putea să-ți faci propriul motor de căutare și să o faci, dar ar fi destul de greu.

Răspuns

Doar ca referință , Ajutorul Google pentru operatorii de căutare este aici .

Interesant este că „-” este încă un operator pentru excluderea cuvintelor, dar au eliminat „+” ca operator, folosit în trecut pentru a solicita un anumit termen de căutare. Se pare că „Operatorul + a fost retras când a fost lansat Google+, deoarece + era necesar ca personaj de căutare și nu ca operator.” ( https://support.google.com/websearch/answer/2466433 )

Răspuns

Puteți începe cu o căutare detaliată pe Google pentru a elimina textul țintă pentru a căuta. Apoi deschideți, să zicem, primele 50 de rezultate în mai multe file și utilizați mingyi „s” Căutare rapidă „Firefox addon pentru a căuta rezultatele folosind o expresie regulată.

Răspuns

Google acceptă și documentează complet utilizare din RegEx. Iată linkul de referință:

http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html

Comentarii

  • ‘ numai pentru Postini.

Răspuns

Dacă cunoașteți VBA, puteți scrie un cod pentru a obține date de pe web în Excel. Rulez programul zi și noapte și pot obține milioane de rezultate. După aceea, puteți filtra din aceste rezultate.

Comentarii

  • oh, Doamne … iertați-ne păcatele

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *