サーバーログで学んだことから、 64.249で始まるIPアドレスはgoogleに属しています。コンピューターでGoogleのホスト検索を実行すると、すべて74.125.226で始まる11の異なるIPアドレスを受け取ります。

次に、ここに移動します http://www.iplists.com/ そしてそこを見つけてください “googleのIPアドレスがたくさんあります。

googleのコマンドプロンプトでwhoisルックアップを実行し、”検索の中止50件のレコードが見つかりました….. “GOOGLE.COM.ANGRYPIRATES.COMやGOOGLE.COM.AFRICANBATS.ORGなどの珍しい名前のサーバーと、これまでに見たことのないさまざまなIPアドレスなどがあります。 91.218.229.20。

私がやりたいのは、実際のGoogleIPアドレスをホワイトリストに登録することです。これまでに見つけたすべてのIPアドレスをホワイトリストに登録する必要がありますか、それともGoogleアドレスをホワイトリストに登録する前に他の予防策を講じる必要がありますか?

IPを検索している他の人に頼りたくないソース http://www.iplists.com/ などのアドレスは、IPアドレスはいつでも変更される可能性があり、更新したいのでホワイトリストは頻繁に使用されます。

コメント

  • 残念ながら、から収集されたホワイトリストを使用してIP 'をブロックします。自分自身やどこでも無意味です。有害なボットやスクレーパーなどは、IP 'を頻繁に変更します。他のホスティング会社と同じように、IPアドレスをブロック単位で売買します。無駄にするのではありません。最近のほとんどの忙しいサイトが機能するのと同じように、実際には現在使用しているこのネットワークと同じように、ユーザーが多くの情報を要求するように制限する設定を使用する方がよいでしょう。また、それらのブラックリストを設定することもできます。 r X時間、不快感を繰り返す場合、これまでで最も効果的な方法ですが、最も安全な方法を気にしないでください。
  • @SimonHayter私も同じことをします。ホワイトリストとブラックリストがあります。ブラックリストはほとんど空です。 2つの間には、すべてのユーザーが監視され、人間またはボットであると判断された灰色のリストがあります。それらがボットである場合は、ホワイトリストを確認し、リストにない場合は、ジャンクコンテンツとアクセスの性質をログに記録します。すべてのユーザーはすぐにログファイルと比較されます。ログ内のすべてのものは、戻ってこないか、動作を開始しない場合、時間の経過とともにパージされます。これはかなりうまく機能しており、すぐにシステムを改善する予定です。

回答

Googlebot / Googleを確認するための公式ドキュメント:

Googleは静的 whitelist "。

Webクローラーがサーバーにアクセスしているかどうかを確認できます実際には Googlebot(または別のGoogleユーザーエージェント)です。これは、スパマーやその他のトラブルメーカーがGooglebotであると主張しているときにサイトにアクセスしていることが懸念される場合に役立ちます。 GoogleはウェブマスターのIPアドレスの公開リストをホワイトリストに投稿しません。これは、これらのIPアドレス範囲が変更される可能性があるためです。は、それらをハードコーディングしたWebマスターに問題を引き起こすため、次に説明するようにDNSルックアップを実行する必要があります。

Googlebotを発信者として確認するには:

  1. hostコマンドを使用して、ログからアクセスしているIPアドレスに対して逆引きDNSルックアップを実行します。
  2. ドメイン名を確認します。はgooglebot.comまたはgoogle.comのいずれかにあります。
  3. 取得したドメイン名に対してhostコマンドを使用して、手順1で取得したドメイン名に対して逆引きDNSルックアップを実行します。ログからの元のアクセスIPアドレスと同じであることを確認します。

(自分自身を強調)

実際の例については、Googleドキュメントを参照してください:
https://support.google.com/webmasters/answer/80553?hl=en

回答

まず最初に。

私たちが話しているドメイン名は2つあります。 Google.comとGooglebot.com。 Google.comを逆検索すると、誤解を招く可能性があります。

これは、8年以上にわたってサイトをクロールするために使用されたGoogleIPアドレスの監査を行ったかなり前の回答です。これはすべてを網羅したリストではありませんが、履歴ビューを提供する可能性があります。

Googleは173.194.90.xxxIPを使用しています'は?なぜgooglebot.comポインタではないのですか?

このリストでは、表示されているIPアドレス範囲64.249が正しいことがわかります。

簡単に説明しましたこの回答を監査します。これは、googlebot(エージェント名)の現在のホワイトリストです。ワイルドカードはご容赦ください。範囲をより効率的に理解するためにコードを更新しましたが、リストを更新していません。ごめんなさい。この場合、単純な正規表現を使用してIPアドレスをリストと比較し、最小限のトリックで*を正規表現が理解できるものに置き換えます。コードを使用してIPアドレスをリスト全体と比較できるため、十分に高速です。

64.233.160.* 64.233.161.* 64.233.162.* 64.233.163.* 64.233.164.* 64.233.165.* 64.233.166.* 64.233.167.* 64.233.168.* 64.233.169.* 64.233.170.* 64.233.171.* 64.233.172.* 64.233.173.* 64.233.174.* 64.233.175.* 64.233.176.* 64.233.177.* 64.233.178.* 64.233.179.* 64.233.180.* 64.233.181.* 64.233.182.* 64.233.183.* 64.233.184.* 64.233.185.* 64.233.186.* 64.233.187.* 64.233.188.* 64.233.189.* 64.233.190.* 64.233.191.* 66.249.64.* 66.249.65.* 66.249.66.* 66.249.67.* 66.249.68.* 66.249.69.* 66.249.70.* 66.249.71.* 66.249.72.* 66.249.73.* 66.249.74.* 66.249.75.* 66.249.76.* 66.249.77.* 66.249.78.* 66.249.79.* 66.249.80.* 66.249.82.* 66.249.83.* 66.249.84.* 66.249.85.* 66.249.86.* 66.249.87.* 66.249.88.* 66.249.89.* 66.249.90.* 66.249.91.* 66.249.92.* 66.249.93.* 66.249.94.* 66.249.95.* 74.125.* 173.194.* 

GOOGLE.COM.ANGRYPIRATES.COMおよびGOOGLE.COM .AFRICANBATS.ORGは、ドメインまたはサブドメインハックとして知られているものです。これらはGoogleにまったく属していません。これは、誰でもいつでも任意のドメイン名に対して実行できることです。これがどのように行われるかについての詳細に立ち入ることなく、あなたはネット上で情報を見つけることができます。ここで説明してこの動作を奨励したくありません。

コメント

  • ありがとうございます!どんな方法でも、'は、適切なリスト形式でなくても(つまり、'であっても、更新されたリストを提供できます。正規表現で)?編集:そして、Google以外の他のボットも、持っていて'共有してもかまわない場合。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です