「本質的に、すべてのモデルが間違っていますが、いくつかは便利です。」

— Box、George EP;ノーマンR.ドレーパー(1987)。経験的モデル-構築および応答サーフェス、p。 424、ワイリー。 ISBN0471810339。

上記のフレーズの意味は正確には何ですか?

コメント

  • 同じ本で以前に言及されました:Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful.多分これはもっと役に立ちます。

回答

その意味は、2つの部分に分けて分析するのが最適だと思います。

「すべてのモデルが間違っている」、つまり、現実を単純化したものであるため、すべてのモデルが間違っています。一部のモデル、特に「ハード」サイエンスでは、少しだけ間違っています。彼らは摩擦や小さな体の重力効果のようなものを無視します。他のモデルは非常に間違っています-彼らはより大きなものを無視します。社会科学では、私たちは多くを無視します。

「しかしいくつかは有用です」-現実の単純化は非常に有用です。それらは、私たちが宇宙とそのすべてのさまざまな構成要素を説明し、予測し、理解するのに役立ちます。

これは統計だけに当てはまるわけではありません。マップはモデルの一種です。間違っています。しかし、良いマップは非常に便利です。他の便利で間違ったモデルの例はたくさんあります。

コメント

  • +1原因マップのアナロジーが好きです。’将来使用します!
  • “ハード”科学の多くのモデルもかなり遠いです(昨日、モデルがどこで測定されるかを測定するセミナーに参加しましたエラーバー内にありましたが、エラーバーは2桁でした。
  • +1。キーセンテンスは”だと思います。現実の単純化”。人々はこれを忘れがちです。たとえば、経済に対する素朴な批判の場合です(私自身の批判もありますが、”現実はモデルよりも複雑です”)。単純化すると、生の現実があり、複雑すぎて理解できません。したがって、洞察を得るために単純化する必要があります。
  • 1:1の縮尺の完全写像のファンタジーは、ルイスキャロル、ホルヘルイスボルヘス、ウンベルトエーコなど多くの著者によって使用されています。マッピングする領域のように複雑で理解しにくいため、実際には役に立ちません(展開してレイアウトして読むのが面倒なことは言うまでもありません)。
  • できるかもしれません。また、モデルは少し間違っている必要があります。そうしないと、一般化されず、他の場所に適用できないためです。これをさらに下に言ういくつかの答えがあります。しかし、今では答えが多すぎてすべてを読むことはできません。

答え

これは有用な洞察を提供できることを意味しますモデル化する現象の完全な表現ではないモデルから。

統計モデルは、数学的概念を使用したシステムの記述です。そのため、多くの場合、推論手順を容易にするために特定の抽象化レイヤーを追加します(たとえば、測定誤差の正規性、相関構造の複合対称性など)。私たち自身が世界の主観的な見方をしていることを考えると、単一のモデルで現実世界の現象を完全に説明することはほとんど不可能です(私たちの感覚システムは完全ではありません)。それにもかかわらず、私たちの世界には私たちが利用するある程度の一貫性があるため、成功した統計的推論は起こります。したがって、ほとんどの場合間違ったモデル有用であることが証明されます。

(きっとあなたはすぐに大胆な答えを得るでしょうが、私は簡潔にしようとしましたこれについて!)

コメント

  • これらの便利なモデルはおおよその解決策を提供していると言えますか?
  • @gpuguy :もちろんできます。ジョン・テューキーを引用するには:An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem.(実際、JT ‘の引用は驚くほど洞察に満ちています。)
  • “常に正確にすることができる間違った質問に対する正確な答えよりも、しばしば曖昧な正しい質問に対するおおよその答えの方がはるかに優れています。” John W. Tukey 1962データ分析の未来。数学統計学年報33:1-67(pp.13-14を参照)他の時期にも同様のことを言ったことは間違いありませんが、’は通常のソースです。
  • 元の出版物から私のものをコピーしました。

回答

これを見つけましたThadTarpeyによる 2009 JSAトークで、Boxのパッセージに関する有用な説明と解説を提供します。彼は、モデルを真実の近似と見なすと、すべてのモデルを同じように簡単に正しく呼び出すことができると主張しています。

要約は次のとおりです:

統計学の学生は、ジョージボックスの有名な引用にしばしば紹介されます:「すべてのモデルが間違っている、いくつかは有用です。」この講演では、この引用は有用ではありますが間違っていると主張します。別のより前向きな見方は、モデルが単にデータから関心のある情報を抽出する手段であることを認めることです。真実は無限に複雑であり、モデルは単に真実の近似にすぎません。近似が不十分または誤解を招く場合、モデルは役に立ちません。この講演では、真のモデルではない正しいモデルの例を示します。 「間違った」モデルの概念がどのように間違った結論につながる可能性があるかを説明します。

回答

誰も追加していないため、George Boxは引用されたフェーズを使用して、本の次のセクションを紹介しました。彼は彼の意味を説明するのに最善の仕事をしていると思います。

現実の世界に存在するシステムがあれば、それは非常に注目に値します。正確に任意の単純なモデルで表されます。ただし、巧妙に選択された倹約的なモデルは、非常に有用な近似を提供することがよくあります。たとえば、圧力 $ P $ 、体積pan class = “に関連する $ PV = RT $ の法則”理想的なと温度 $ T $ 定数 $ R $ を介した “aa2d54a958”>

ガスは、実際のガスには正確には当てはまりませんが、有用な近似値を提供することが多く、さらにその構造はガス分子の振る舞いの物理的観点から生じるため、有益です。

このようなモデルの場合、質問する必要はありません”モデルは正しいですか?”。 “真実”が”完全な真実である場合”答えは”いいえ”である必要があります。関心のある唯一の質問は、”モデルは明るくて便利ですか?”です。

Box、GEP(1979 )、”科学モデル構築の戦略における堅牢性”、ローナー、RL;ウィルキンソン、GN、統計におけるロバストネス、アカデミックプレス、201〜236ページ。

回答

私にとって、実際の洞察は次の側面にあります。

モデルはそうする必要はありません。

残念ながら、多くの科学では、新しい発見を可能にするために、モデルが必ずしも現実を正確に表現している必要はないことを忘れがちです。

無数の変数の正確な測定を必要とする複雑なモデルを構築するのに時間を無駄にしないでください。真の天才は、仕事をする単純なモデルを発明します。

回答

結果にランダム性がある場合、モデルは100%正確な予測を提供できません。不確実性、ランダム性、エラーがない場合、その場合、モデルではなく事実と見なされます。モデルは頻繁に使用されるため、最初の方法は非常に重要です。発生していないイベントの期待をモデル化するために使用されます。これは、実際のイベントについてある程度の不確実性があることをほぼ保証します。

完全な情報が与えられれば、理論的には、そのような正確に知られているイベントの完全な予測を与えるモデルを作成することが可能かもしれません。ただし、これらのありそうもない状況を考慮しても、そのようなモデルは計算上使用できないほど複雑であり、他の要因によって値がイベントによってどのように変化するかが変わるため、特定の時点でのみ正確になる可能性があります。

ほとんどの実世界のデータには不確実性とランダム性が存在するため、完全なモデルを取得するための努力は無駄な作業です。代わりに、データとその使用に必要な計算の両方の観点から使用できるほど単純な、十分に正確なモデルを取得することを検討する方が価値があります。これらのモデルは不完全であることが知られていますが、これらの欠陥のいくつかはよく知られており、モデルに基づいた意思決定のために考慮することができます。

単純なモデルは不完全かもしれませんが、推論するのも簡単です。 、相互に比較するためであり、計算量が少なくなる可能性が高いため、操作が簡単な場合があります。

回答

もしよければ、もう1つだけコメントが役立つかもしれません。私が好むpraseのバージョンは

(…)すべてのモデルは近似値です。基本的に、すべてのモデルが間違っていますが、いくつかは便利です(…)

Box and Draper(2007、p。414、Wiley)による応答曲面、混合物、およびリッジ分析から取得。拡張された見積もりを見ると、Boxの意味がより明確になっています。統計モデリングは現実を近似することであり、近似は決して正確ではないため、最も適切な近似を見つけることです。 。あなたの目的に適しているのは主観的なものです。そのため、それは有用なモデルの1つではありませんが、モデリングの目的によっては、おそらくいくつかは有用です。

回答

このように考えるかもしれません。オブジェクトの最大の複雑さ(つまり、エントロピー)は、何らかの形式のベッケンシュタイン境界に従います:

$$ I \ le \ frac { 2 \ pi RE} {\ hbar c \ ln 2} $$

ここで、$ E $は質量を含む総静止エネルギーであり、$ R $はオブジェクトを囲む球の半径です。

それは多くの場合、大きな数字です:

ベッケンシュタイン境界平均的な人間の脳の場合は$ 2.58991・10 ^ {42} $ビットであり、平均的な人間の脳を量子レベルまで完全に再現するために必要な情報の上限を表します。これは、さまざまな状態の数を意味します。人間の脳(および物理学が真実である場合は心)の($Ω= 2 ^ I $)は最大で$ 107.79640・10 ^ {41} $です。

では、「最良のマップ」、つまり領域自体を、すべてのセル内のすべての粒子のすべての波動方程式とともに使用しますか?絶対にそうではありません。計算上の障害になるだけでなく、よあなたは本質的にあなたが気にしていることとは何の関係もないかもしれないものをモデル化するでしょう。たとえば、私が起きているかどうかを確認するだけの場合は、ニューロン#844030リボソーム#2305分子#2で電子#32458が何をしているのかを知る必要はありません。それをモデル化しない場合、モデルは確かに「間違っている」のですが、私が起きているかどうかを識別できれば、モデルは間違いなく役立ちます。

回答

Peterとuser11852が素晴らしい答えを出したと思います。また、(否定によって)モデルが本当に良ければ、過剰適合のためにおそらく役に立たないだろうと付け加えます(したがって、一般化できません)。

コメント

  • +1は、過剰適合のポイントです。単純ベイズや線形判別分析などのアルゴリズムは、基礎となるモデルが正しくないことがわかっている場合でも(スパムフィルタリングなど)、パラメータの推定に必要なデータが少ないという理由だけで、非常にうまく機能することがよくあります。

回答

私の酸の解釈は次のとおりです。数学モデルがすべての要因とそれらの相互作用を正確に記述していると信じて、関心のある現象を管理するのは単純すぎますと傲慢。私たちが使用する論理が私たちの宇宙を理解するのに十分であるかどうかさえわかりません。ただし、一部の数学モデルは、そのような現象について結論を出すのに役立つ(科学的方法の観点から)十分な近似を表しています。

回答

宇宙統計学者(おそらく珍しい品種)として、私はBoxの口述の名声が不幸だと感じています。物理科学では、観察された現象の根底にあるプロセスを理解するための強いコンセンサスを持っていることがよくあります。これらのプロセスは、重力、量子力学、熱力学などの法則から生じる数学モデルで表現できることがよくあります。統計的目標は、モデルの選択と検証だけでなく、最適なモデルパラメータの物理的特性を推定することです。劇的な最近の事例が発生しました。 2013年3月にリリースされた、欧州宇宙局のプランク衛星による宇宙マイクロ波背景の測定からの論文で、単純な6パラメーターの `LambdaCDM 「ビッグバのモデルng。 Boxの口述が、これら29の論文で使用されている幅広い高度な統計手法のどこにでも適用されるとは思えません。

回答

プロセスモデルを焦点と見なして上記の答えを言い換えたところです。このステートメントは次のように解釈できます。

「すべてのモデルが間違っている」、つまり、すべてのモデルが間違っているのは、現実。一部のモデルは少しだけ間違っています。たとえば、->要件の変更、->期限内のプロジェクトの完了の無視、->顧客の希望する品質レベルの考慮なしなど。 …他のモデルは非常に間違っています-彼らはより大きなものを無視します。従来のソフトウェアプロセスモデルは、無視が少ないアジャイルプロセスモデルと比較して、多くを無視します。

「しかし、いくつかは有用です」-現実の単純化は非常に役立つ場合があります。これらは、プロジェクト全体とそのすべてのさまざまなコンポーネントを説明、予測、および理解するのに役立ちます。モデルは、その機能がほとんどのソフトウェア開発プログラムに対応しているために使用されます。

回答

「役に立つ」という用語の別の解釈を示したいと思います。おそらく、1つのボックスが考えたものではありません。

決定を下す必要があり、これが最終的にすべての情報に使用される場合は、何らかの形で成功を測定する必要があります。不確実な情報を伴う意思決定について話すとき、この尺度はしばしば効用と呼ばれます。

したがって、有用なモデルは、より多くの情報に基づいた意思決定を可能にするモデルと考えることもできます。目標をより効果的に達成するために。

これにより、モデルが何かを正しく予測する能力など、通常の基準に加えて別の次元が追加されます。これにより、モデルのさまざまな側面をそれぞれに対して比較検討できます。その他。

回答

「すべてのモデルが間違っていますが、いくつかは便利です」。おそらくそれは、私たちが知っていることと新しい学習を探すことで、できる限り最善を尽くすべきだということを意味しますか?

コメント

  • (-1)G.E.P。を示唆する参考資料を提供してください。ボックスはそれを意味しましたか?他の回答からわかるように、彼はまったく異なる何かを意味していました。
  • OPはおそらく引用を取り、それに新しい解釈を与えています。 Boxが多かれ少なかれ’モデルを現実の正確な解釈と見なさないと言っていたが、一部のモデルがデータを適切に記述できることを認識しているというティムに同意します。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です