Googleが正規表現検索を提供すると非常に便利です。

これを行う方法はありますか?

(OBS:site:、、ANDORまたは"Text".+[]^のような正規表現で検索します。

たとえば、?

回答

この機能は従来のGoogle検索では利用できず、 Googleのロードマップ。このトピックの詳細については、Googleのビデオをご覧ください Googleは正規表現で検索する機能を実装しますか?

ただし、 1つの例外。 Googleコード検索は正規表現をサポートしています。もちろん、このトピック検索エンジンの検索対象はソースコードのみに限定されています。

一部のGoogle検索キーワードは、正規表現を部分的に置き換えることができることに注意してください。たとえば、「search TERM」の2語のバリエーションを検索する場合は、ワイルドカード演算子を使用できます。

search * 

検索結果やその他の(1つの)単語が見つかります。私はよく、基本的な英語の文法規則や同義語を確認するために使用します(例: “*と同じくらい簡単” )。

コメント

回答

Google検索では、いくつかの単純な正規表現の一致を返すことができます。たとえば、検索クエリ

"(gray|red) (wolf|fox)" 

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox") 

あなたと同等であるように見えますこの検索クエリの出力はここで確認できます。

Google検索では"ワイルドカードも使用できます検索文字列に"文字が含まれているため、 "the quick brown * (jumped|jumps) over the * dog"のようなパターンの検索結果を見つけることができます。

コメント

  • 薬または化学名を検索しています。 " heme ?? llnate "を読むことができます-疑問符が判読できません。 Googleは'役に立ちません。

回答

SymbolHound には、現在廃止されているGoogleコード検索オプションと同様に、オープンソースのコードリポジトリ検索があります。 Stackoverflowなどのプログラミング関連サイトにインデックスを付けるシンボルを含むWeb検索に加えて。

コメント

  • SymbolHoundと提携している場合は、次のことができます。あなたはあなたのプロフィールでこれを述べます。ありがとう!

回答

次の宛先にソフトウェアを作成できます。

  1. 正規表現からキーワードを取得します。
  2. キーワードをGoogleで検索し、結果のリストを取得します。
  3. 結果の各URIをクロールし、完全な正規表現でフィルタリングします。

ケースを調べてみましょう:site:gog.comからスペイン語のナレーションがあるすべてのゲームを見つけます。

正規表現は次のとおりです。

Audio[^:]*:[^.,]*Spanish 

一致するものとします。例:

Audio lanuage: English, German, Spanish, French. 

一致しない場合:

Audio language: only-English. Text language: Spanish. 

ステップ1.ソフトウェアにGoogleでこれを検索させます:

site:gog.com audio Spanish inurl:game 

inurl:gameここでは、ゲームの説明ページでのみ検索することを意味します

ステップ2.300のリンクを取得し、それらすべてにクロールします。

ステップ3。指定された正規表現で結果をフィルタリングします。

Audio[^:]*:[^.,]*Spanish 

これは簡単に作成できるはずです。実際、なぜ私がすでにそのように構築されているものを見つけることができませんでした。

検索エンジンは正規表現でデータをスキャンするためのリソースを買う余裕がないため、この汚い仕事はあなたの側にあり、コンピュータはそれを行う必要があります検索エンジンがすでに提供しているものを使用します。

コメント

  • +1。ありがとう。これは実際には非常に興味深いアイデアです。主な問題は、本当に面白いことをするために、おそらく高性能クラスターが必要になるということです。
  • ええと、私は今この拡張機能を書いています。 li ' >

回答

いいえ、残念ながらそうではありません:(。理論的には、独自の検索エンジンを作成して実行することもできますが、それはかなり難しいでしょう。

回答

参考までに、Googleの検索演算子に関するヘルプはこちらです。

興味深いことに、「-」は依然として単語除外の演算子ですが、削除されました演算子としての「+」は、過去に特定の検索用語を要求するために使用されていました。どうやら、「+演算子は、演算子ではなく検索可能な文字として必要だったため、Google +の起動時に廃止されました。」( https://support.google.com/websearch/answer/2466433

回答

詳細なGoogle検索から始めて、検索するターゲットテキストを選別します。次に、たとえば、上位50件の結果を複数のタブで開き、 mingyiの「最速検索」を使用します。 「Firefoxアドオンは、通常の式を使用して結果を検索します。

回答

Googleは、使用する RegExの。参考リンクは次のとおりです。

http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html

コメント

  • その'はPostini専用です。

回答

VBAを知っている場合は、WebからExcelにデータを取得するためのコードを記述できます。私は昼夜を問わずプログラムを実行し、何百万もの結果を得ることができます。その後、それらの結果からフィルタリングできます。

コメント

  • ああ、神様…私たちの罪を許してください

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です