Från vad jag lärde mig i mina serverloggar, IP-adresser som börjar med 64.249 tillhör google. När jag gör en värdsökning på min dator för google får jag 11 olika IP-adresser som alla börjar med 74.125.226.

Jag går sedan hit http://www.iplists.com/ och ta reda på det ”en massa fler IP-adresser för google.

Jag gjorde till och med en whois-sökning i en kommandotolk för google och se” Avbryter sökning 50 poster hittades ….. ”tillsammans med en hel massa servrar med ovanliga namn som GOOGLE.COM.ANGRYPIRATES.COM och GOOGLE.COM.AFRICANBATS.ORG. Tillsammans med olika IP-adresser som jag inte har sett tidigare, t.ex. 91.218.229.20.

Vad jag vill göra är att vitlista riktiga google IP-adresser. Ska jag bara gå vidare och vitlista varje enskild IP-adress som jag hittills hittat eller finns det andra försiktighetsåtgärder jag borde vidta innan jag listar en google-adress?

Jag vill inte lita på att andra söker efter IP adresser för mig som källan http://www.iplists.com/ eftersom IP-adresserna kan ändras när som helst och jag vill uppdatera mina vitlista ofta.

Kommentarer

  • Tyvärr blockerar IP ’ s med en vitlista samlad från dig själv eller var som helst meningslöst. Skadliga robotar, skrapor och så vidare, byter ofta IP ’ s. De köper och säljer IP-adresser i block, som alla andra webbhotell skulle göra. din tid är bättre att använda en inställning som stryker användarna för att be om mycket information för att snabbt, på samma sätt som de mest upptagna webbplatserna fungerar idag, faktiskt också samma som det här nätverket du använder nu. Du kan också ställa in en svart lista för r X timmar om de upprepar förolämpning, den absolut effektivaste metoden, tänk inte på den säkraste metoden.
  • @ SimonHayter Jag gör samma sak. Jag har en vitlista och en svartlista. Den svarta listan är nästan tom. Mellan de två finns en grå lista där alla användare ses och bestäms för att vara mänskliga eller en bot. Om de är en bot kontrollerar jag den vita listan och om de inte finns på listan får de skräpinnehåll och arten av deras åtkomst loggad. Varje användare jämförs omedelbart med loggfilen. Allt i stocken rensas över tiden om de inte kommer tillbaka eller börjar bete sig. Detta har fungerat ganska bra och jag planerar att förbättra systemet snart.

Svar

Från officiella dokument för att verifiera Googlebot / Google :

Observera att Google inte rekommenderar att du använder en statisk ” vitlista ”.

Du kan verifiera om en webbsökare har åtkomst till din server är verkligen Googlebot (eller en annan Google-användaragent) . Detta är användbart om du är orolig för att spammare eller andra bråkmakare besöker din webbplats medan de påstår sig vara Googlebot. Google lägger inte upp en offentlig lista med IP-adresser för webbansvariga att vitlista . Detta beror på att dessa IP-adressintervall kan ändras, orsakar problem för alla webbansvariga som har hårdkodat dem, så du måste köra en DNS-sökning som beskrivs nedan.

För att verifiera Googlebot som den som ringer:

  1. Kör en omvänd DNS-sökning på åtkomst-IP-adressen från dina loggar med hjälp av värdkommandot.
  2. Kontrollera att domännamnet finns antingen på googlebot.com eller google.com.
  3. Kör en DNS-sökning framåt på domännamnet som hämtades i steg 1 med värdkommandot på det hämtade domännamnet. Verifiera att den är densamma som den ursprungliga åtkomst-IP-adressen från dina loggar.

(Betona min egen)

Se Google-dokumenten för ett fungerat exempel:
https://support.google.com/webmasters/answer/80553?hl=en

Svar

Första saker först.

Det finns två domännamn som vi pratar om; Google.com och Googlebot.com. Att göra en omvänd uppslagning av Google.com skulle vara vilseledande.

Här är ett svar som jag gav för ett tag sedan där jag gjorde en granskning av Googles IP-adresser som används för att genomsöka min webbplats under åtta år. Detta är inte listan över alla, men kan ge en historisk bild.

Vad använder Google 173.194.90.xxx IP ’ för? Varför är det inte en googlebot.com-pekare?

I den här listan kan du se IP-adressintervallet 64.249 som du ser är korrekt.

Jag gjorde en snabb granskning för detta svar. Detta är min nuvarande vitlista för googlebot (agentnamn). Förlåt jokerteckningen. Jag har uppdaterat min kod för att förstå intervaller mer effektivt, men har inte uppdaterat listan. Förlåt.I det här fallet använder jag bara ett enkelt reguljärt uttryck för att jämföra IP-adressen med listan med ett minimum av knep för att ersätta * med något som regex förstår. Jag kan jämföra en IP-adress med hela listan med min kod så att den fortfarande är snabb nog.

64.233.160.* 64.233.161.* 64.233.162.* 64.233.163.* 64.233.164.* 64.233.165.* 64.233.166.* 64.233.167.* 64.233.168.* 64.233.169.* 64.233.170.* 64.233.171.* 64.233.172.* 64.233.173.* 64.233.174.* 64.233.175.* 64.233.176.* 64.233.177.* 64.233.178.* 64.233.179.* 64.233.180.* 64.233.181.* 64.233.182.* 64.233.183.* 64.233.184.* 64.233.185.* 64.233.186.* 64.233.187.* 64.233.188.* 64.233.189.* 64.233.190.* 64.233.191.* 66.249.64.* 66.249.65.* 66.249.66.* 66.249.67.* 66.249.68.* 66.249.69.* 66.249.70.* 66.249.71.* 66.249.72.* 66.249.73.* 66.249.74.* 66.249.75.* 66.249.76.* 66.249.77.* 66.249.78.* 66.249.79.* 66.249.80.* 66.249.82.* 66.249.83.* 66.249.84.* 66.249.85.* 66.249.86.* 66.249.87.* 66.249.88.* 66.249.89.* 66.249.90.* 66.249.91.* 66.249.92.* 66.249.93.* 66.249.94.* 66.249.95.* 74.125.* 173.194.* 

GOOGLE.COM.ANGRYPIRATES.COM och GOOGLE.COM .AFRICANBATS.ORG är det som kallas ett domän- eller subdomänhack. Dessa tillhör inte Google alls. Detta är något vem som helst kan göra mot vilket domännamn som helst. Utan att gå in i detaljerna om hur detta görs kan du hitta information på nätet. Jag vill inte uppmuntra detta beteende genom att förklara det här.

Kommentarer

  • Tack! På något sätt kan du ’ tillhandahålla den uppdaterade listan, även om den inte är i ett trevligt listformat (dvs. även om den ’ s i en regex)? REDIGERA: Och alla andra bots förutom Google, om du har dem och inte ’ tänker dela dem.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *