Hvordan køres grep med flere AND-mønstre?

Question

Jeg vil gerne få multimønsteret match med implicit OG mellem mønstre, dvs. svarer til at køre flere greps i en sekvens:

grep pattern1 | grep pattern2 | ...

Så hvordan konverteres det til noget lignende?

grep pattern1 & pattern2 & pattern3

Jeg vil gerne bruge single grep, fordi jeg bygger argumenter dynamisk, så alt skal passe i en streng. Brug af filter er systemfunktion, ikke grep, så det er ikke et argument for det.

Forveksl ikke dette spørgsmål med:

grep "pattern1\|pattern2\|..."

Dette er en ELLER matchning med flere mønstre.

Kommentarer

Lignende: Match alle mønstre fra fil på én gang
Lignende spørgsmål på SO : Kontroller, om der findes flere strenge eller regexes i en fil
Hvis du ‘ kigger til grep-syntaksen for ” find linjer, der indeholder foo og linjer, der indeholder bar ” se ved hjælp af grep til flere søgemønstre

Answer 1

agrep kan gøre det med denne syntaks:

agrep "pattern1;pattern2"

Med GNU grep, når den er bygget med med PCRE-understøttelse kan du gøre:

grep -P "^(?=.*pattern1)(?=.*pattern2)"

Med ast grep :

grep -X ".*pattern1.*&.*pattern2.*"

(tilføjer .* s som <x>&<y> matcher strenge, der matcher både <x> og <y> nøjagtigt , a&b ville aldrig matche, da der ikke er sådan en streng, der kan være både a og b på samme tid).

Hvis mønstrene ikke overlapper hinanden, kan du muligvis også gøre:

grep -e "pattern1.*pattern2" -e "pattern2.*pattern1"

Den bedste bærbare måde er sandsynligvis med awk som allerede nævnt:

awk "/pattern1/ && /pattern2/"

Med sed:

sed -e "/pattern1/!d" -e "/pattern2/!d"

Vær opmærksom på, at alle disse har forskellige syntaks for regulært udtryk.

Kommentarer

agrep syntaksen fungerer ikke for mig … hvilken version blev den introduceret i?
@Raman 2.04 fra 1992 havde den allerede. Jeg ‘ har ingen grund til at tro, at det ikke var ‘ der fra starten. Nyere (efter 1992) versioner af agrep kan findes inkluderet i glimt / webglimpse . Muligvis har du en anden implementering. Jeg havde dog en fejl i ast-grep-versionen, men indstillingen for augmented regexps er -X, ikke -A.
@St é phaneChazelas Tak, jeg har agrep 0.8.0 på Fedora 23. Dette ser ud til være en anden agrep end den, du henviser til.
@Raman, din lyder som TRE agrep .
@Techiee eller bare awk '/p1/ && /p2/ {n++}; END {print 0+n}'

Answer 2

Du har ikke angivet grep-version, dette er vigtigt. Nogle regexp-motorer tillader flere matchende grupperinger af OG ved hjælp af “& “men dette er ikke-standard og ikke-bærbar funktion. Men i det mindste understøtter GNU grep ikke dette.

OTOH du kan simpelthen erstatte grep med sed, awk, perl osv. . (opført i rækkefølge efter vægtforøgelse). Med awk ser kommandoen ud som

 awk "/regexp1/ && /regexp2/ && /regexp3/ { print; }"

, og den kan konstrueres til at angives på kommandolinjen på en nem måde.

Kommentarer

Bare husk at awk bruger ERE ‘ s, f.eks. svarende til grep -E i modsætning til BRE ‘ s, som almindelig grep bruger.
awk ‘ s regexes kaldes EREer, men faktisk ‘ er lidt idiosynkratisk. Her er sandsynligvis flere detaljer, end nogen holder af: wiki.alpinelinux.org/wiki/Regex
Tak, grep 2.7.3 ( openSUSE). Jeg opstemte dig, men jeg holder spørgsmål åbent et stykke tid, måske er der noget trick for grep (ikke at jeg ikke kan lide awk – det er bare bedre at vide mere).
Standardhandlingen er at udskrive den matchende linje, så { print; } -delen er ikke ‘ t virkelig nødvendig eller nyttig her.

Answer 3

Hvis patterns indeholder et mønster pr. linje, du kan gøre noget som dette:

 awk "NR==FNR{a[$0];next}{for(i in a)if($0!~i)next}1" patterns -

Eller dette matcher understrenge i stedet for almindelige udtryk:

 awk "NR==FNR{a[$0];next}{for(i in a)if(!index($0,i))next}1" patterns -

For at udskrive alt i stedet for ingen linjer af input i hvis patterns er tom, skal du erstatte NR==FNR med FILENAME==ARGV[1] eller med ARGIND==1 i gawk.

Disse funktioner udskriver linjerne i STDIN, som indeholder hver streng, der er angivet som et argument som en understreng. ga står for grep all og gai ignorerer store og små bogstaver.

 ga(){ awk "FILENAME==ARGV[1]{a[$0];next}{for(i in a)if(!index($0,i))next}1" <(printf %s\\n "$@") -; } gai(){ awk "FILENAME==ARGV[1]{a[tolower($0)];next}{for(i in a)if(!index(tolower($0),i))next}1" <(printf %s\\n "$@") -; }

Kommentarer

skarpt svar, der adresserer flere anvendelsessager og fungerer (verificeret på macos)

Answer 4

grep pattern1 | grep pattern2 | ...

Jeg vil gerne bruge single grep, fordi jeg bygger argumenter dynamisk , så alt skal passe i en streng

Det er faktisk muligt at opbygge rørledningen dynamisk (uden at ty til eval):

 # Executes: grep "$1" | grep "$2" | grep "$3" | ... function chained-grep { local pattern="$1" if [[ -z "$pattern" ]]; then cat return fi shift grep -- "$pattern" | chained-grep "$@" } cat something | chained-grep all patterns must match order but matter dont

Det er sandsynligvis ikke en særlig effektiv løsning.

Kommentarer

Brug enten chained-grep() eller function chained-grep men ikke function chained-grep(): unix.stackexchange.com/questions/73750/…
Kan du beskrive, hvad tricket er? Kan du føje det til svaret ( uden ” Rediger: “, ” Opdatering: ” eller lignende) ved at redigere det ?
Omformuleret svaret for at gøre tricket klarere (dvs.: opbygge en shell-rørledning dynamisk)

Answer 5

Her er min optagelse, og dette fungerer for ord i flere linjer:

Brug find . -type f efterfulgt af lige så mange
-exec grep -q "first_word" {} \;
og det sidste søgeord med
-exec grep -l "nth_word" {} \;

-q stille / lydløs
-l vis filer med matches

Følgende returnerer en liste med filnavne med ordene “kanin” og “hul” i:
find . -type f -exec grep -q "rabbit" {} \; -exec grep -l "hole" {} \;

Kommentarer

Hvis du ser nøje, kan du bare lære, at dette ikke er den funktion, som spørgsmålet beder om.

Answer 6

`ripgrep`

Her er eksemplet ved hjælp af rg :

rg -N "(?P<p1>.*pattern1.*)(?P<p2>.*pattern2.*)(?P<p3>.*pattern3.*)" file.txt

Det er et af de hurtigste grepping-værktøjer, da det er bygget oven på Rusts regex-motor , der bruger endelige automata, SIMD og aggressive bogstavelige optimeringer for at gøre søgning meget hurtig.

^{Se også relateret funktionsanmodning på GH-875 .}

Answer 7

For at finde alle ordene (eller mønstrene) kan du køre grep i en for -sløjfe. Den største fordel her er at søge fra en liste over regulære udtryk .

Et rigtigt eksempel:

# File "search_all_regex_and_error_if_missing.sh" find_list="\ ^a+$ \ ^b+$ \ ^h+$ \ ^d+$ \ " for item in $find_list; do if grep -E "$item" file_to_search_within.txt then echo "$item found in file." else echo "Error: $item not found in file. Exiting!" exit 1 fi done

Lad os nu køre det på denne fil:

hhhhhhhhhh aaaaaaa bbbbbbbbb ababbabaabbaaa ccccccc dsfsdf bbbb cccdd aa caa

$ ./search_all_regex_and_error_if_missing.sh aaaaaaa aa ^a+$ found in file. bbbbbbbbb bbbb ^b+$ found in file. hhhhhhhhhh ^h+$ found in file. Error: ^d+$ not found in file. Exiting!

Kommentarer

Din logik er defekt – jeg bad om ALL operatør, din kode fungerer som OR operator, ikke AND. Og btw. For det (OR) er meget lettere løsning givet lige i spørgsmålet.
@greenoldman Logikken er enkel: For vil løkke på ALLE ord / mønstre på listen, og hvis den findes i filen – vil udskrive den. Så fjern den anden, hvis du ikke ‘ ikke har brug for handling, hvis ordet ikke blev fundet.
Jeg forstår din logik såvel som mit spørgsmål – jeg spurgte om AND operatør, hvilket betyder at filen kun er et positivt hit, hvis det matcher mønster A og mønster B og mønster C og … AND I dit tilfælde er filen et positivt hit, hvis den ma tches mønster A eller mønster B eller … Ser du forskellen nu?
@greenoldman ikke sikker på, hvorfor du mener, at denne løkke ikke kontrollerer OG-tilstand for alle mønstre? Så jeg ‘ har redigeret mit svar med et rigtigt eksempel: Det vil søge i filen efter alle regex af listen, og på den første, der mangler – vil afslutte med fejl.
Du har det lige foran dine øjne, du har en positiv match lige efter at den første kamp er udført. Du skal have ” samle ” alle resultater og beregne AND på dem. Derefter skal du omskrive scriptet for at køre på flere filer – så måske indser du, at spørgsmålet allerede er besvaret, og dit forsøg bringer ikke noget til bordet, undskyld.

Hvordan køres grep med flere AND-mønstre?

Kommentarer

Svar

Kommentarer

Svar

Kommentarer

Svar

Kommentarer

Svar

Kommentarer

Svar

`git grep`

Kommentarer

Svar

Kommentarer

Svar

`ripgrep`

Svar

Kommentarer

Skriv et svar Annuller svar