Ich erinnere mich, dass ich als Student in Statistikkursen saß und hörte, warum Extrapolation eine schlechte Idee war. Darüber hinaus gibt es eine Vielzahl von Online-Quellen, die dies kommentieren. Es gibt auch eine Erwähnung hier .

Kann mir jemand helfen zu verstehen, warum Extrapolation eine schlechte Idee ist? Wenn ja, wie Ist es so, dass Prognosetechniken nicht statistisch ungültig sind?

Kommentare

  • @Firebug Mark Twain hatte etwas dazu zu sagen. Die entsprechende Passage wird gegen Ende meiner Antwort unter stats.stackexchange.com/a/24649/919 zitiert.
  • @whuber I. Vermutung, dass ‚ nicht genau extrapoliert wird, wenn man jetzt darüber nachdenkt. Angenommen, wir trainieren und validieren einen Algorithmus ordnungsgemäß, um Daten eine Woche nach Beginn der Funktion vorherzusagen. Wenn ich das richtige Resampling durchführe (und abstimme, wenn Hyperparameter eingestellt werden müssen), kann ich ‚ nicht sehen, was ‚ falsch ist, wenn Sie haben eine Antwort und sollten auch das Vertrauen dieser Antwort kennen. Wenn Sie Ihren Algorithmus nun von Woche zu Woche trainieren, können Sie ‚ nicht erwarten, ein Jahr in der Zukunft genau vorherzusagen. Entschuldigen Sie die mögliche Verwirrung.
  • @Firebug Sie müssen sich nicht entschuldigen – Ihre Anmerkungen enthalten nützliche Informationen zur Klärung. Während ich sie lese, schlagen sie vor, dass “ extrapolieren “ in einer Prognoseeinstellung mehrere Interpretationen haben kann. Zum einen handelt es sich um eine “ -Extrapolation “ der Zeit. Wenn Sie sich jedoch Standard-Zeitreihenmodelle ansehen, insbesondere solche, bei denen die Zeit keine explizite Kovariate ist, sagen sie zukünftige Werte in Bezug auf vorherige Werte voraus. Wenn diese vorherigen Werte innerhalb der Bereiche früherer vorheriger Werte bleiben, führt das Modell überhaupt keine Extrapolation durch! Darin liegt möglicherweise eine Auflösung des scheinbaren Paradoxons.
  • xkcd.com/605
  • Ich ‚ bin enttäuscht darüber, wie lange es gedauert hat, bis das obligatorische xkcd

Antwort

Für die Extrapolation wird häufig ein Regressionsmodell verwendet, dh die Antwort auf eine Eingabe, die außerhalb von liegt Der Bereich der Werte der Prädiktorvariablen, die zur Anpassung an das Modell verwendet werden. Die mit der Extrapolation verbundene Gefahr ist in der folgenden Abbildung dargestellt. Diagramm mit extrapolierter Linie nach oben, wobei

true “ Wert nimmt ab

Das Regressionsmodell ist „per Konstruktion“ ein Interpolationsmodell und sollte nicht für die Extrapolation verwendet werden, es sei denn, ist dies richtig gerechtfertigt.

Kommentare

  • Dies ist ein schreckliches Beispiel gegen Extrapolation. Die Daten der geraden Regressionsgeraden passen viel besser als Ihre kurvige wahre Funktion.
  • “ Die Daten der geraden Regressionslinie passen viel besser als Ihre kurvige wahre Funktion “ Diese Aussage ist falsch. Das RSS für die wahre Regressionsfunktion ist kleiner als das RSS für die einfache Regressionslinie.
  • Punkt genommen und Sie können (sollten) Recht haben. Aber nach der Menge der Punkte zu urteilen, gibt es keine Möglichkeit, auf die wahre Funktion zu schließen.
  • Genau. Aus diesem Grund kann eine Extrapolation eine schlechte Idee sein.
  • “ Das Regressionsmodell ist „per Konstruktion“ ein Interpolationsmodell “ – > Ich denke, wir können genau das gleiche Problem mit der Interpolation haben (auch wenn ‚ weniger wahrscheinlich ist)

Antwort

Dieser xkcd-Comic erklärt dies all.

mg src = „https://i.stack.imgur.com/4QwTj.png“ alt = „xkcd comic“ title = „By the Im dritten Trimester werden Hunderte von Babys in Ihnen sein. „>

Unter Verwendung der Datenpunkte, die Cueball (der Mann mit dem Stock) hat, hat er extrapoliert, dass die Frau“ vier Dutzend „haben wird „Ehemänner bis Ende nächsten Monats und verwendeten diese Extrapolation, um zum Abschluss des Kaufs der Hochzeitstorte in loser Schüttung zu führen.

Bearbeiten Sie 3: Für diejenigen unter Ihnen, die sagen „er hat nicht genug Datenpunkte“, er re „s ein weiterer xkcd-Comic :

mg src =“ https://i.stack.imgur.com/7oDyK.png „alt =“ xkcd comic „title =“ Obwohl 100 Jahre länger sind als viele unserer Ressourcen. „>

Hier die Verwendung der Das Wort „nachhaltig“ wird im Laufe der Zeit in einem Semi-Log-Diagramm angezeigt. Durch Extrapolation der Datenpunkte erhalten wir unangemessene Schätzungen darüber, wie oft das Wort „nachhaltig“ in Zukunft vorkommen wird.

Bearbeiten 2: Für diejenigen unter Ihnen, die sagen „Sie benötigen auch alle vergangenen Datenpunkte“, Noch ein xkcd-Comic: mg src = „https://i.stack.imgur.com/JTTW1.png“ alt = „xkcd comic“ title = „2031: Google verteidigt das Schwenken Auf dem Dach montierte Rasterelektronenmikroskope an seinen Street View-Fahrzeugen sagen, dass sie ‚ ‚ nichts enthüllen, was nicht ‚ wird von keinem Fußgänger gesehen, der Ihr Haus mit einem Elektronenmikroskop scannt.“>

Hier haben wir alle vergangenen Datenpunkte, aber wir können die Auflösung von nicht genau vorhersagen Google Earth. Beachten Sie, dass dies auch ein Semi-Log-Diagramm ist.

Bearbeiten: Manchmal sogar das stärkste von (r = .9979 in diesem Fall) Korrelationen sind einfach falsch.


Wenn Sie ohne andere Belege extrapolieren, verletzen Sie auch die -Korrelation, was keine Kausalität bedeutet ; Eine weitere große Sünde in der Welt der Statistik.

Wenn Sie X mit Y extrapolieren, müssen Sie jedoch sicherstellen, dass Sie genau (genug, um zu befriedigen) können Ihre Anforderungen) sagen X nur mit Y voraus. Fast immer gibt es mehrere Faktoren als Auswirkungen auf X.

I. Ich möchte einen Link zu einer anderen Antwort teilen, die dies mit den Worten von Nassim Nicholas Taleb erklärt.

Kommentare

  • xkcd hat einen Witz über jedes mögliche mathematische / statistische Problem, auf das man stoßen kann, nicht ‚?
  • Diese Idee könnte genauso gut als Argument gegen die Interpolation verwendet werden: “ letzte Nacht hatten Sie 0,5 Ehemänner „.
  • @JiK Wenn Sie nur wissen, dass sie jetzt eine hat und vor zwei Tagen keine hatte, ist das keine schlechte Schätzung 😉
  • Nachhaltig Nachhaltig Nachhaltig Nachhaltig Nachhaltig Nachhaltig Nachhaltig nachhaltig. en.wikipedia.org/wiki/…
  • mehr xkcd, Leute!

Antwort

“ Die Vorhersage ist sehr schwierig, insbesondere wenn “ s über die Zukunft „. Das Zitat wird vielen Menschen in irgendeiner Form zugeschrieben . Ich beschränke mich im Folgenden “ Extrapolation “ auf “ Vorhersage außerhalb des bekannten Bereichs “ und in einer eindimensionalen Umgebung Extrapolation von einer bekannten Vergangenheit in eine unbekannte Zukunft.

Was ist also falsch an der Extrapolation? Zuerst Es ist nicht einfach, die Vergangenheit zu modellieren . Zweitens ist es schwierig zu wissen, ob ein Modell aus der Vergangenheit verwendet werden kann für die Zukunft . Hinter beiden Behauptungen stecken tiefe Fragen zur Kausalität oder Ergodizität , ausreichende erklärende Variablen usw., die ganz vom Fall abhängen. Was falsch ist, ist, dass es schwierig ist, ein einzelnes Extrapolationsschema zu wählen, das in verschiedenen Kontexten ohne viele zusätzliche Informationen gut funktioniert.

Diese generische Nichtübereinstimmung wird in der Anscombe-Quartett-Datensatz (siehe unten). Die lineare Regression ist auch (außerhalb des $ x $ -Koordinatenbereichs) eine Extrapolationsinstanz. Dieselbe Linie regressiert vier Punktmengen mit derselben Standardstatistik. Die zugrunde liegenden Modelle sind jedoch sehr unterschiedlich: Das erste ist Standard. Der zweite ist ein parametrischer Modellfehler (ein Polynom zweiten oder dritten Grades könnte besser geeignet sein), der dritte zeigt eine perfekte Anpassung mit Ausnahme eines Wertes (Ausreißer?), Der vierte ein Mangel an glatten Beziehungen (Hysterese?). P. >

Anscombe-Quartett

Prognosen können jedoch bis zu einem gewissen Grad korrigiert werden . Zusätzlich zu anderen Antworten können einige Zutaten zur praktischen Extrapolation beitragen:

  1. Sie können die Proben entsprechend ihrer Entfernung (Index $ n $ ) zu dem Ort $ p $ , an dem Sie möchten zu extrapolieren. Verwenden Sie beispielsweise eine zunehmende Funktion $ f_p (n) $ (mit $ p \ ge n $ ). B. exponentielle Gewichtung oder Glättung oder Schiebefenster von Stichproben, um älteren Werten eine geringere Bedeutung zu verleihen.
  2. Sie können mehrere Extrapolationsmodelle verwenden und diese kombinieren oder die besten auswählen ( Prognosen kombinieren , J. Scott Armstrong, 2001).In letzter Zeit gab es eine Reihe von Arbeiten zu ihrer optimalen Kombination (ich kann bei Bedarf Referenzen angeben).

Vor kurzem war ich an einem Projekt zur Extrapolation von Werten für die Kommunikation von Simulationen beteiligt Subsysteme in einer Echtzeitumgebung. Das Dogma in diesem Bereich war, dass Extrapolation Instabilität verursachen kann. Wir haben tatsächlich festgestellt, dass die Kombination der beiden oben genannten Bestandteile sehr effizient ist, ohne dass eine Instabilität erkennbar ist (noch ohne formalen Beweis: CHOPtrey: Kontextuelle Online-Polynomextrapolation für eine verbesserte Mehrkern-Co-Simulation von komplexe Systeme , Simulation, 2017). Und die Extrapolation arbeitete mit einfachen Polynomen mit einem sehr geringen Rechenaufwand, wobei die meisten Operationen zuvor berechnet und in Nachschlagetabellen gespeichert wurden.

Da die Extrapolation lustige Zeichnungen vorschlägt, ist das Folgende die Rückwärtsbewegung Effekt der linearen Regression:

Spaß mit Liebe und linearer Regression

Kommentare

  • +1 Schöne Antwort. Laut dieser Website scheint es unwahrscheinlich, dass Bohr es gesagt hat. Es scheint eher ein ungewöhnliches, aber allgemeines dänisches Sprichwort zu sein.
  • @ usεr11852 Es ist unwahrscheinlich, dass er “ jemals gesagt hat, dass „? Deshalb habe ich “ “ zugeschrieben, sollte ich vorsichtiger sein?
  • Ich habe das nie gesagt jemals Teil. Ich habe diesen Kommentar abgegeben, weil es angesichts der Tatsache, dass das Sprichwort viel wahrscheinlicher ein dänisches Sprichwort zu sein scheint, die Zuordnung zu einem bestimmten (äußerst emblematischen) Dänen etwas übertrieben ist – insbesondere angesichts der Tatsache, dass es keine Aufzeichnungen darüber gibt, dass Bohr es sagt. Der ursprüngliche Autor könnte ein unbenannter Fischer sein, der den Fang von morgen ‚ kommentiert! Ich bin auf der Suche nach dem kleinen Kerl hier! : D
  • Es ist sehr schwierig, auch frühere Zitatlegenden zu modellieren.
  • In der Frage werden sicherlich beide Wörter verwendet: Der springende Punkt ist, ob “ Die Vorhersage von “ muss als eine Form der “ Extrapolation betrachtet werden. “ Gemäß Ihrer Einführung Kommentare, Sie scheinen Extrapolation als Verwendung der Vergangenheit zu definieren, um “ die Zukunft zu modellieren. “ Bis Sie klare und eindeutige Definitionen für jede bieten, Ihre Antwort könnte missverstanden werden.

Antwort

Obwohl die Passform eines Modells möglicherweise „ gut“ ist „, Extrapolation außerhalb des Datenbereichs muss skeptisch behandelt werden. Der Grund dafür ist, dass in vielen Fällen die Extrapolation (leider und unvermeidlich) auf nicht testbaren Annahmen über das Verhalten der Daten beruht, die über ihre beobachtete Unterstützung hinausgehen.

Bei der Extrapolation müssen zwei Beurteilungsaufrufe durchgeführt werden: Erstens aus quantitativer Sicht Wie gültig ist das Modell außerhalb des Datenbereichs? Zweitens, wie plausibel ist aus qualitativer Sicht ein Punkt $ x_ {out} $, der außerhalb des beobachteten Stichprobenbereichs liegt, ein Mitglied der Population zu sein, die wir für die Stichprobe annehmen? Da beide Fragen einen gewissen Grad an Mehrdeutigkeitsextrapolation beinhalten, wird sie auch als mehrdeutige Technik angesehen. Wenn Sie Gründe haben zu akzeptieren, dass diese Annahmen zutreffen, ist die Extrapolation normalerweise ein gültiges Inferenzverfahren.

Eine zusätzliche Einschränkung besteht darin, dass viele nichtparametrische Schätztechniken keine native Extrapolation zulassen. Dieses Problem macht sich insbesondere bei der Spline-Glättung bemerkbar, bei der keine Knoten mehr vorhanden sind, um den angepassten Spline zu verankern.

Lassen Sie mich betonen, dass Extrapolation alles andere als böse ist. Zum Beispiel numerische Methoden, die in der Statistik weit verbreitet sind (zum Beispiel Aitkens Delta-Quadrat-Prozess und Richardson “ s Extrapolation ) sind im Wesentlichen Extrapolationsschemata, die auf der Idee basieren, dass das zugrunde liegende Verhalten der für die beobachteten Daten analysierten Funktion über die Unterstützung der Funktion hinweg stabil bleibt.

Kommentare

  • Obwohl es möglich ist, Schutzmaßnahmen für Wynn $ \ varepsilon $ (die rechnerisch nützliche Verallgemeinerung von Aitken $ \ Delta ^ 2 $) und Richardson-Extrapolation zu schreiben, kann und kann es vorkommen, dass die diesen zugrunde liegenden Annahmen Algorithmen sind mit Sequenzen, die ihr zugeführt werden, nicht sehr zufrieden. Wenn diese Extrapolationsmethoden mit Sequenzen unsicherer Herkunft verwendet werden, verfügt der ausreichend Paranoide normalerweise über zwei oder mehr dieser Konvergenzbeschleunigungsmethoden zum Testen und vertraut den Ergebnissen nur, wenn at Mindestens zwei dieser konzeptionell sehr unterschiedlichen Methoden stimmen überein e in ihren Ergebnissen.

Antwort

Im Gegensatz zu anderen Antworten würde ich sagen, dass nichts falsch ist mit Extrapolation, soweit es nicht sinnlos verwendet wird.Beachten Sie zunächst, dass Extrapolation ist:

der Schätzprozess über das Original hinaus Beobachtungsbereich, der Wert einer Variablen auf der Grundlage ihrer Beziehung zu einer anderen Variablen.

… also ist es sehr breiter Begriff und viele verschiedene Methoden, die von einfacher linearer Extrapolation bis zu linearer Regression, polynomieller Regression oder sogar einigen fortgeschrittenen Zeitreihen-Prognosemethoden reichen, passen zu dieser Definition. Tatsächlich sind Extrapolation, Vorhersage und Prognose eng miteinander verbunden. In Statistiken machen wir häufig Vorhersagen und Prognosen . Dies ist auch der Link, auf den Sie verweisen:

Wir werden vom ersten Tag der Statistik an unterrichtet, dass Extrapolation ist ein großes Nein-Nein, aber genau das ist Prognose.

Viele Extrapolationsmethoden werden verwendet , um Vorhersagen zu treffen. Außerdem funktionieren häufig einige einfache Methoden mit kleinen Stichproben ziemlich gut und können daher bevorzugt werden dann die komplizierten. Das Problem besteht, wie in anderen Antworten festgestellt, darin, dass Sie die Extrapolationsmethode nicht ordnungsgemäß anwenden.

Beispielsweise zeigen viele Studien, dass das Alter der sexuellen Initiation in westlichen Ländern mit der Zeit abnimmt. Werfen Sie einen Blick auf eine Handlung unter dem Alter des ersten Geschlechtsverkehrs in den USA. Wenn wir blind die lineare Regression verwenden würden, um das Alter des ersten Geschlechtsverkehrs vorherzusagen, würden wir vorhersagen, dass es in einigen Jahren unter Null geht (dementsprechend, wenn die erste Ehe und die erste Geburt irgendwann nach dem Tod stattfinden) … Wenn Sie dies jedoch tun müssten Prognose für ein Jahr voraus, dann würde ich vermuten, dass eine lineare Regression zu ziemlich genauen kurzfristigen Vorhersagen für den Trend führen würde.

Bildbeschreibung hier eingeben

(Quelle guttmacher.org )

Ein weiteres gutes Beispiel stammt aus einer völlig anderen Domäne, da es sich um “ Extrapolation von “ für Tests handelt, die von Microsoft Excel durchgeführt werden (siehe unten) (Ich weiß nicht, ob dies bereits behoben ist oder nicht). Ich kenne den Autor dieses Bildes nicht, es stammt von Giphy .

Bildbeschreibung hier eingeben

Alle Modelle sind falsch , Extrapolation ist auch falsch, da es Ihnen nicht ermöglichen würde, präzise Vorhersagen zu treffen. Wie bei anderen mathematischen / statistischen Werkzeugen können Sie ungefähre Vorhersagen treffen. Wie genau sie sein werden, hängt von der Qualität der Daten ab, über die Sie verfügen, und zwar unter Verwendung der für Ihr Problem geeigneten Methoden, der Annahmen, die Sie bei der Definition Ihres Modells getroffen haben, und vielen anderen Faktoren. Dies bedeutet jedoch nicht, dass wir solche Methoden nicht anwenden können. Wir können, aber wir müssen uns an ihre Einschränkungen erinnern und sollten ihre Qualität für ein bestimmtes Problem bewerten.

Kommentare

  • Wenn die Daten, die Sie für die Regression verwenden, in den frühen 1980er Jahren enden, können Sie wahrscheinlich leicht testen, wie lange nach diesem Datum eine Extrapolation funktionieren würde.
  • @gerrit Ich stimme zu, aber Leider konnte ich ‚ keine geeigneten Daten finden. Aber wenn jemand darauf hinweisen könnte, würde ich ‚ gerne meine Antwort für einen solchen Vergleich aktualisieren.
  • In diesem Fall schlägt die Extrapolation fehl Das Alter des ersten Geschlechts ist in den letzten Jahren sprunghaft angestiegen. (Die Daten hierfür liegen jedoch aus offensichtlichen Gründen immer um einige Jahrzehnte hinter dem Geburtsjahr zurück.)

Antwort

Das Beispiel von Nassim Taleb (das eine Adaption eines früheren Beispiels von Bertrand Russell war) gefällt mir sehr gut:

Betrachten Sie einen Truthahn jeden Tag gefüttert. Jede einzelne Fütterung wird den Glauben des Vogels festigen, dass es die allgemeine Lebensregel ist, jeden Tag von freundlichen Mitgliedern der Menschheit gefüttert zu werden, „die nach ihren besten Interessen Ausschau halten“, wie ein Politiker sagen würde Am Mittwoch vor Thanksgiving wird dem Truthahn etwas Unerwartetes passieren, was zu einer Überarbeitung des Glaubens führen wird.

Einige mathematische Analoga sind die folgenden:

  • Die Kenntnis der ersten Taylor-Koeffizienten einer Funktion garantiert nicht immer, dass die nachfolgenden Koeffizienten Ihrem vermuteten Muster folgen.

  • Kenntnis von Die Anfangsbedingungen einer Differentialgleichung garantieren nicht immer die Kenntnis ihres asymptotischen Verhaltens (z. B. Lorenz Gleichungen, manchmal verzerrt in den sogenannten „Schmetterlingseffekt“).

Hier ist ein netter MO-Thread zu diesem Thema.

Kommentare

  • … und natürlich muss Taleb auf die moralische Lehre hinweisen: “ don ‚ sei kein Truthahn „! In diesem Zusammenhang: don ‚ sei kein nachlässiger Extrapolator, und ‚ erliege nicht der Sünde der Hybris.
  • @ uoɥʇʎPʎzɐɹC, ich war nicht ‚ nicht danach fragen, aber danke!
  • ‚ kann nicht wirklich für eine kreuzvalidierte Reputation verwendet werden – und niemand hat Ihre Antwort und gesehen Es war wirklich gut. Viel Spaß!

Antwort

Denken Sie über die folgende Geschichte nach, wenn Sie so wollen.

I. Denken Sie auch daran, in einem Statistikkurs zu sitzen, und der Professor sagte uns, Extrapolation sei eine schlechte Idee. Dann sagte er uns während des nächsten Unterrichts, es sei wieder eine schlechte Idee; Tatsächlich sagte er es zweimal.

Ich war für den Rest des Semesters krank, aber ich war mir sicher, dass ich nicht viel Material verpassen konnte, denn bis zur letzten Woche muss der Typ es sicher haben Ich habe nichts getan, als den Leuten immer wieder zu sagen, dass Extrapolation eine schlechte Idee war.

Seltsamerweise habe ich bei der Prüfung nicht sehr gut abgeschnitten.

Kommentare

  • In der Frage wird “ gefragt, was mit der Extrapolation nicht stimmt. „. Wir suchen nach Antworten, die Gründe dafür angeben, warum Extrapolation eine schlechte Idee sein könnte.
  • @RobertLong: ‚ ist eigentlich eine Art Meta / Witz-Antwort, und ziemlich ähnlich zu xkcd.com/605 – immer noch besser als Kommentar als als Antwort.
  • @NeilSlater: Du hättest posten sollen Ihr Kommentar als Antwort … 🙂
  • @RobertLong: Dies ist diese Art von Antwort. Es hat einfach die Form einer Parabel.
  • Es ist nicht klar, dass Ihr Modell exponentiell ist.

Antwort

Die Frage ist nicht nur statistisch, sondern auch erkenntnistheoretisch. Extrapolation ist eine der Methoden, mit denen wir etwas über die Natur lernen. Sie ist eine Form der -Induktion . Nehmen wir an, wir haben Daten zur elektrischen Leitfähigkeit eines Materials in einem Temperaturbereich von 0 bis 20 Grad Celsius. Was können wir über die Leitfähigkeit bei 40 Grad Celsius sagen?

Sie hängt eng mit klein zusammen Stichprobeninferenz: Was können wir aus Messungen an einer kleinen Stichprobe über die gesamte Population sagen? Dies wurde von Gosset as Guiness gestartet, der Student-T-Distributionen entwickelte. Vor ihm haben sich die Statistiker nicht die Mühe gemacht, über kleine Proben nachzudenken, vorausgesetzt, die Probengröße kann immer groß sein. Er war in Guinnes und musste sich mit Bierproben befassen, um zu entscheiden, was mit der gesamten zu versendenden Biercharge geschehen soll.

In der Praxis (Wirtschaft), im Ingenieurwesen und in der Wissenschaft müssen wir also immer in gewisser Weise extrapolieren. Es kann sein, dass kleine Stichproben auf große Stichproben oder von einem begrenzten Bereich von Eingabebedingungen auf einen breiteren Satz von Bedingungen von extrapoliert werden Was passiert im Beschleuniger mit dem, was mit einem Milliarden Kilometer entfernten Schwarzen Loch usw. passiert ist? Es ist jedoch besonders wichtig in der Wissenschaft, wie wir wirklich lernen, indem wir die Diskrepanzen zwischen unseren Extrapolationsschätzungen und tatsächlichen Messungen untersuchen. Oft finden wir neue Phänomene, wenn die Diskrepanzen groß oder konsistent sind.

Daher sage ich, dass es kein Problem mit der Extrapolation gibt. Das müssen wir jeden Tag tun. Es ist einfach schwierig.

Antwort

Extrapolation selbst ist nicht unbedingt böse, aber es ist ein Prozess, für den man sich eignet Schlussfolgerungen, die unvernünftiger sind als bei der Interpolation.

  • Extrapolation wird häufig durchgeführt, um Werte zu untersuchen, die weit von der abgetasteten Region entfernt sind. Wenn ich 100 Werte von 0 bis 10 abtastet und dann nur ein wenig extrapoliere, nur auf 11, ist mein neuer Punkt wahrscheinlich zehnmal weiter von einem Datenpunkt entfernt, als eine Interpolation jemals erreichen könnte. Dies bedeutet, dass es solche gibt so viel mehr Platz für eine Variable, um (qualitativ) außer Kontrolle zu geraten. Beachten Sie, dass ich absichtlich nur eine geringfügige Extrapolation gewählt habe. Es kann weitaus schlimmer werden.
  • Die Extrapolation muss mit Kurvenanpassungen durchgeführt werden, die für die Extrapolation vorgesehen waren. Beispielsweise sind viele Polynomanpassungen für die Extrapolation sehr schlecht, da Terme, die sich über den abgetasteten Bereich gut verhalten, explodieren können, sobald Sie sie verlassen. Eine gute Extrapolation hängt von einer „guten Vermutung“ ab, was außerhalb des abgetasteten Bereichs geschieht. Das bringt mich zu …
  • Aufgrund des Vorhandenseins von Phasenübergängen ist die Extrapolation oft äußerst schwierig. Viele Prozesse, auf die man extrapolieren möchte, haben eindeutig nichtlineare Eigenschaften, die über den abgetasteten Bereich nicht ausreichend belichtet sind. Die Luftfahrt mit Schallgeschwindigkeit ist ein hervorragendes Beispiel. Viele Extrapolationen von niedrigeren Geschwindigkeiten fallen auseinander, wenn Sie die Geschwindigkeit der Informationsübertragung in der Luft erreichen und überschreiten.Dies tritt auch häufig bei Soft Sciences auf, bei denen die Richtlinie selbst den Erfolg der Richtlinie beeinflussen kann. Die keynesianische Wirtschaft extrapolierte das Verhalten der Wirtschaft bei unterschiedlichen Inflationsraten und prognostizierte das bestmögliche Ergebnis. Leider gab es Effekte zweiter Ordnung und das Ergebnis war nicht wirtschaftlicher Wohlstand, sondern einige der höchsten Inflationsraten, die die USA gesehen haben.
  • Menschen mögen Extrapolationen. Im Allgemeinen möchten die Leute wirklich, dass jemand in eine Kristallkugel schaut und ihnen die Zukunft erzählt. Sie akzeptieren überraschend schlechte Extrapolationen, einfach weil es sich um alle Informationen handelt, die sie haben. Dies macht die Extrapolation an sich vielleicht nicht schlecht, aber es ist definitiv etwas, das man bei der Verwendung berücksichtigen sollte.

Für die ultimative Extrapolation betrachten Sie das Manhattan-Projekt. Die Physiker dort waren gezwungen, mit extrem kleinen Tests zu arbeiten, bevor sie das Original konstruierten. Sie hatten einfach nicht genug Uran, um es für Tests zu verschwenden. Sie taten das Beste, was sie konnten, und sie waren schlau. Als der letzte Test stattfand, wurde jedoch entschieden, dass jeder Wissenschaftler entscheiden würde, wie weit er von der Explosion entfernt sein wollte, wenn sie losging. Es gab erhebliche Meinungsverschiedenheiten darüber, wie weit weg „sicher“ war, da jeder Wissenschaftler wusste, dass er ziemlich weit von seinen Tests extrapolierte. Es gab sogar eine nicht triviale Überlegung, dass sie die Atmosphäre mit der Atombombe in Brand setzen könnten, ein Problem, das auch durch erhebliche Extrapolation behoben wurde!

Antwort

Viele gute Antworten hier, ich möchte nur versuchen, das zu synthetisieren, was ich als Kern des Problems betrachte: Es ist gefährlich, über den Datenerzeugungsprozess hinaus zu extrapolieren, der zur Schätzung der Stichprobe geführt hat. Dies wird manchmal als „Strukturwandel“ bezeichnet.

Die Prognose geht von Annahmen aus. Die wichtigste ist, dass der Datengenerierungsprozess (so gut wie kein wesentlicher Unterschied) derselbe ist, der die Stichprobe generiert hat (mit Ausnahme der rhs-Variablen, deren Änderungen Sie vornehmen explizit im Modell berücksichtigen). Wenn eine strukturelle Änderung auftritt (d. H. Thanksgiving in Talebs Beispiel), sind alle Wetten ungültig.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.