Muistan, että istuin tilastokursseilla alaikäisten kuulemisena siitä, miksi ekstrapolointi oli huono idea. Lisäksi verkossa on useita lähteitä, jotka kommentoivat tätä. Siitä mainitaan myös täällä .

Voiko kukaan auttaa minua ymmärtämään, miksi ekstrapolointi on huono idea? Jos on, miten eikö ennustetekniikat ole tilastollisesti virheellisiä?

Kommentit

  • @Firebug Mark Twainilla oli jotain sanottavaa siitä. Asiaankuuluva kohta lainataan vastauksen loppupuolella osoitteessa stats.stackexchange.com/a/24649/919 .
  • @whuber I arvaa, että se ei ole ’ täsmälleen ekstrapolointi ajatellen sitä nyt. Oletetaan, että koulutamme ja validoimme algoritmin, jolla ennustetaan tiedot viikkoon ominaisuuteen. Oikeiden uudelleennäytteiden tekeminen (ja viritys, jos viritettäviä hyperparametreja on), voin ’ nähdä, mitä ’ on väärin, jos että sinulla on vastaus ja sinun pitäisi myös tietää vastauksen luottamus. Jos nyt koulutat algoritmiasi viikoittain, ’ ei voi odottaa tarkkaan ennustavan vuoden tulevaisuuteen. Pahoittelemme mahdollista sekaannusta.
  • @Firebug Ei tarvitse pyytää anteeksi – huomautuksesi sisältävät hyödyllisiä selventäviä tietoja. Kun luen niitä, he ehdottavat, että ” ekstrapoloinnilla ” voi olla useita tulkintoja ennusteasetuksissa. Yksi on se, että siihen liittyy ” ekstrapolointi ” aikaa. Mutta kun tarkastellaan tavallisia aikasarjamalleja, etenkin niitä, joissa aika ei ole nimenomainen kovariaatti, ne ennustavat tulevaisuuden arvot aiempien arvojen perusteella . Kun nämä edelliset arvot pysyvät aikaisempien arvojen rajoissa, malli ei suorita lainkaan ekstrapolointia! Siinä saattaa olla näennäisen paradoksin resoluutio.
  • xkcd.com/605
  • Olen ’ pettynyt siihen, kuinka kauan pakollisen xkcd: n ilmestyminen kesti

vastaus

Regressiomallia käytetään usein ekstrapoloimiseen, ts. ennustetaan vastaus tuloon, joka on malliin sopivan ennustemuuttujan arvojen alue. Ekstrapolaatioon liittyvä vaara on esitetty seuraavassa kuvassa. kaavio, joka näyttää ekstrapoloidun viivan, joka jatkuu ylöspäin, missä

true ” arvo pienenee

Regressiomalli on ”rakenteeltaan” interpolointimalli, eikä sitä tule käyttää ekstrapolointiin, ellei tämä ole oikein perusteltu.

Kommentit

  • Tämä on kauhea esimerkki ekstrapolointia vastaan. Suoran regressiolinjan sovitusdatapisteet ovat paljon parempia kuin käyrä tosi funktiosi.
  • ” Suora regressioviiva sopii datapisteisiin paljon paremmin kuin käyrä tosi funktiosi id = ”f10c625d1c”> Tämä lause on väärä. Todellisen regressiotoiminnon RSS on pienempi kuin yksinkertaisen regressioviivan RSS.
  • Otettu piste ja saatat olla (pitäisi) olla oikeassa. Mutta pisteerästä päätellen ei voida mitenkään päätellä todellista toimintoa.
  • Tarkalleen. Ja tästä syystä ekstrapolointi voi olla huono idea.
  • ” Regressiomalli on ”rakenteeltaan” interpolointimalli ” – > Luulen, että interpoloinnilla voi olla täsmälleen sama ongelma (vaikka sen ’ tapahtuisi vähemmän)

vastaus

Tämä xkcd-sarjakuva selittää sen kaikki.

mg src = ”https://i.stack.imgur.com/4QwTj.png” alt = ”xkcd koominen” title = ” kolmannella kolmanneksella, sisälläsi on satoja vauvoja. ”>

Käyttäen datapisteitä, joita Cueball (kepillä varustettu mies) on saanut, hän on ekstrapoloinut, että naisella on” neljä tusinaa ”. ”aviomiehet ensi kuun loppuun mennessä ja käyttivät tätä ekstrapolaatiota johtuen siitä, että hääkakku ostettiin irtotavarana.

Muokkaa 3: Niille teistä, jotka sanovat ”hänellä ei ole tarpeeksi datapisteitä”, hän re ”s toinen xkcd-sarjakuva :

mg src =” https://i.stack.imgur.com/7oDyK.png ”alt =” xkcd comic ”title =” Vaikka 100 vuotta on pidempi kuin suuri osa resursseistamme. ”>

Tässä on sana ”kestävä” ajan mittaan näkyy puolilokikaaviossa, ja ekstrapoloimalla datapisteet saamme kohtuuttomia arvioita siitä, kuinka usein sanaa ”kestävä” esiintyy tulevaisuudessa.

Muokkaa 2: Niille teistä, jotka sanovat ”tarvitset myös kaikki aikaisemmat datapisteet”, vielä yksi xkcd-sarjakuva: mg src = ”https://i.stack.imgur.com/JTTW1.png” alt = ”xkcd koominen” title = ”2031: Google puolustaa kääntymistä katolle asennetut pyyhkäisyelektronimikroskoopit Street View -autoillaan sanoen, että ne ’ eivät ’ paljasta mitään, mikä ei voinut ’ Tätä ei voi nähdä kukaan jalankulkija, joka skannaa talosi elektronimikroskoopilla.”>

Täällä meillä on kaikki aikaisemmat datapisteet, mutta emme pysty ennustamaan tarkasti Google Earth. Huomaa, että tämä on myös puolilokikaavio.

Muokkaa: Joskus jopa vahvin (tässä tapauksessa r = .9979) korrelaatiot ovat vain väärin.


Jos ekstrapoloit ilman muita tukevia todisteita, myös -korrelaation rikkominen ei tarkoita syy-yhteyttä ; toinen suuri synti tilastomaailmassa.

Jos ekstrapoloit X: n Y: llä, sinun on kuitenkin varmistettava, että pystyt tarkasti (tarpeeksi tyydyttämään vaatimuksesi) ennustaa X: n vain Y: llä. Lähes aina on useita tekijöitä kuin vaikutus X: ään.

I haluaa jakaa linkin toiseen vastaukseen , joka selittää sen Nassim Nicholas Talebin sanoilla.

Kommentit

  • xkcd: llä on vitsi jokaisesta mahdollisesta matematiikka- tai tilasto-ongelmasta, eikö ’ ole sitä?
  • Tätä ajatusta voidaan yhtä hyvin käyttää argumenttina interpolointia vastaan: ” viime yönä sinulla oli 0,5 aviomiehiä ”.
  • @JiK Jos tiedät vain, että hänellä on sellainen nyt ja kaksi päivää sitten hänellä ei ollut yhtään, se ei ole huono arvio 😉
  • kestävä kestävä kestävä kestävä kestävä kestävä kestävä kestävä Kestävä kestävä. fi.wikipedia.org/wiki/…
  • lisää xkcd, ihmiset!

vastaus

” Ennustaminen on erittäin vaikeaa, varsinkin jos se ” s tulevaisuudesta ”. Lainaus on annettu monille ihmisille jossakin muodossa . Rajoitan seuraavassa ” ekstrapolointi ” ” -ennusteeseen tunnetun alueen ulkopuolella ” ja yksiulotteisessa ympäristössä ekstrapolointi tunnetusta menneisyydestä tuntemattomaan tulevaisuuteen.

Joten mikä on vikaa ekstrapoloinnissa. Ensinnäkin, menneisyyden mallinnaminen ei ole helppoa . Toiseksi, on vaikea tietää, voidaanko menneisyyden mallia käyttää tulevaisuutta varten . Molempien väitteiden takana on syviä syy-aiheita koskevia kysymyksiä tai ergodisuus , selittävien muuttujien riittävyys jne., Jotka ovat melko riippuvaisia tapauksesta. Virhe on se, että on vaikea valita yhtä ekstrapolointijärjestelmää, joka toimii hyvin eri tilanteissa ilman paljon ylimääräistä tietoa.

Tämä yleinen ristiriita on kuvattu selvästi Anscombe-kvartetin tietojoukko alla. Lineaarinen regressio on myös ( $ x $ -koordinaattialueen ulkopuolella) ekstrapoloinnin esimerkki. Sama viiva regressioi neljä pistejoukkoa, samoilla vakiotilastoilla. Taustalla olevat mallit ovat kuitenkin melko erilaisia: ensimmäinen on melko vakio. Toinen on parametrinen mallivirhe (toisen tai kolmannen asteen polynomi voisi sopia paremmin), kolmas osoittaa täydellisen sovituksen yhtä arvoa lukuun ottamatta (outlier?), Neljäs sujuvien suhteiden puute (hystereesi?).

Anscombe-kvartetti

Ennustamista voidaan kuitenkin korjata jossain määrin . Lisäämällä muihin vastauksiin muutama ainesosa voi auttaa käytännön ekstrapoloinnissa:

  1. Voit punnita näytteet etäisyyden mukaan (index $ n $ ) sijaintiin $ p $ , mihin haluat ekstrapoloida. Käytä esimerkiksi kasvavaa funktiota $ f_p (n) $ ( $ p \ ge n $ ) , kuten eksponentiaalinen painotus tai tasoitus tai näytteiden liukuvat ikkunat, jotta vanhemmille arvoille annettaisiin vähemmän merkitystä.
  2. Voit käyttää useita ekstrapolaatiomalleja ja yhdistää ne tai valita parhaat ( Ennusteiden yhdistäminen a Scott Armstrong, 2001).Viime aikoina on tehty useita töitä niiden optimaalisesta yhdistelmästä (voin antaa tarvittaessa viitteitä).

Viime aikoina olen ollut mukana projektissa arvojen ekstrapoloimiseksi simulaation kommunikointia varten. alijärjestelmiä reaaliaikaisessa ympäristössä. Tämän alueen dogma oli, että ekstrapolointi voi aiheuttaa epävakautta. Tajusimme, että kahden edellä mainitun ainesosan yhdistäminen oli erittäin tehokasta, ilman huomattavaa epävakautta (ilman vielä muodollista todistetta: CHOPtrey: kontekstuaalinen online-polynomiekstrapolointi monen ytimen tehostetun simulaation aikaansaamiseksi) monimutkaiset järjestelmät , Simulaatio, 2017). Ja ekstrapolointi toimi yksinkertaisilla polynomeilla, erittäin pienellä laskennallisella rasituksella, suurin osa toiminnoista laskettiin etukäteen ja tallennettiin hakutaulukoihin.

Lopuksi, koska ekstrapolointi ehdottaa hauskoja piirustuksia, seuraava on taaksepäin lineaarisen regression vaikutus:

Hauskaa rakkaudella ja lineaarista regressiota

Kommentit

  • +1 Hieno vastaus. tämän verkkosivuston mukaan on epätodennäköistä, että Bohr olisi sanonut sen. Vaikuttaa todennäköisemmältä harvinaiselta, mutta yleiseltä tanskalaisesta sananlaskusta.
  • @ usεr11852 On epätodennäköistä, että hän ” koskaan sanonut, että ”? Siksi sanoin ” johtuvan ”, pitäisikö minun olla varovaisempi?
  • En koskaan sanonut koskaan osa. Tein tämän kommentin, koska koska sanonta näyttää olevan todennäköisemmin tanskalainen sananlasku, sen osoittaminen tietylle (erittäin symboliselle) tanskalaiselle tuntuu hieman ylilaskutukselta – varsinkin kun ei ole tietoja siitä, että Bohr olisi sanonut sen. Alkuperäinen kirjailija voi olla nimeämätön kalastaja, joka kommentoi huomisen saaliita ’. Juurrun täällä olevan pienen kaverin puolesta! : D
  • Hyvin vaikea mallintaa myös aikaisempia lainausmerkintöjä.
  • Kysymyksessä käytetään varmasti molempia sanoja: koko asia on, onko ” ennustamista ” on pidettävä ” ekstrapoloinnin muotona. ” johdantosi mukaan kommenteissa, näytät määrittelevän ekstrapoloinnin käyttämällä menneisyyttä tulevaisuuden mallintamiseen ”. ” Kunnes tarjoat niistä selkeät ja selkeät määritelmät, vastaustasi voidaan ymmärtää väärin.

Vastaa

Vaikka mallin sopivuus voi olla ” hyvä ”, tietojen alueen ulkopuolista ekstrapolointia on kohdeltava skeptisesti. Syynä on se, että monissa tapauksissa ekstrapolointi (valitettavasti ja väistämättä) perustuu testaamattomiin oletuksiin tietojen käyttäytymisestä niiden havaitun tuen ulkopuolella.

Ekstrapoloinnissa on tehtävä kaksi arviointikutsua: Ensinnäkin kvantitatiivisesta näkökulmasta , kuinka kelvollinen malli on tietojen alueen ulkopuolella? Toiseksi, kuinka uskottavaa on kvalitatiivisesta näkökulmasta piste $ x_ {out} $, joka asetetaan havaitun otosalueen ulkopuolelle, olemaan sen populaation jäsen, jonka oletamme otokselle? Koska molemmat kysymykset edellyttävät tiettyä epäselvyyttä, ekstrapolointia pidetään myös epäselvänä tekniikkana. Jos sinulla on syytä hyväksyä, että nämä oletukset pitävät paikkansa, ekstrapolointi on yleensä kelvollinen pääteltävä menettely.

Lisävaroitus on, että monet muut kuin parametriset estimointitekniikat eivät salli ekstrapolointia luontaisesti. Tämä ongelma on erityisen havaittavissa spline-tasoituksessa, jossa ei ole enää solmuja ankkuroimaan sovitettua uraa.

Haluan korostaa, että ekstrapolointi on kaukana pahasta. Esimerkiksi tilastossa laajalti käytetyt numeeriset menetelmät (esimerkiksi Aitken delta-neliöprosessi ja Richardson ” s Ekstrapolointi ) ovat lähinnä ekstrapolointimenetelmiä, jotka perustuvat ajatukseen, että havaittujen tietojen osalta analysoidun funktion taustalla oleva käyttäytyminen pysyy vakaana koko toiminnon tuella.

Kommentit

  • Althossa on mahdollista kirjoittaa suojatoimenpiteitä Wynn $ \ varepsilon $: lle (laskennallisesti hyödyllinen yleistys Aitken $ \ Delta ^ 2 $: lle) ja Richardsonin ekstrapoloinnille, voi ja tapahtuu, että näiden taustalla olevat oletukset algoritmit eivät ole kovin tyytyväisiä sille syötettyihin sekvensseihin. Kun käytetään näitä ekstrapolointimenetelmiä epäselvän alkuperän sekvenssien kanssa, riittävän paranoidilla on yleensä kaksi tai useampi näistä konvergenssikiihdytysmenetelmistä testattavissa, ja luottaa tuloksiin vain, jos ainakin kaksi näistä käsitteellisesti hyvin erilaisista menetelmistä on samaa mieltä e niiden tuloksissa.

Vastaa

Toisin kuin muut vastaukset, sanoisin, ettei ole mitään vikaa ekstrapoloimalla siltä osin kuin sitä ei käytetä järjettömällä tavalla.Huomaa ensin, että ekstrapolointi on :

arviointiprosessi, alkuperäisen lisäksi havainnointialue, muuttujan arvo sen perusteella, miten se on suhteessa toiseen muuttujaan.

… joten se ”s hyvin laaja termi ja monet erilaiset menetelmät aina yksinkertaisesta lineaarisesta ekstrapoloinnista lineaariseen regressioon, polynomiregressioon tai jopa joihinkin edistyneisiin aikasarjojen ennustamismenetelmiin sopivat tällaiseen määritelmään. Itse asiassa ekstrapolointi, ennustus ja ennuste liittyvät läheisesti toisiinsa. Tilastoissa usein teemme ennusteet ja ennusteet . Tässä viitataan myös viittaamaasi linkkiin:

Meille opetetaan tilastojen ensimmäisestä päivästä alkaen, että ekstrapolointi on iso ei-ei, mutta juuri tämä on ennuste.

Monet ekstrapolointimenetelmät käytetään ennusteiden tekemiseen, ja lisäksi jotkut yksinkertaiset menetelmät toimivat melko hyvin pienten näytteiden kanssa, joten niitä voidaan suositella sitten monimutkaiset. Ongelma on, kuten muissa vastauksissa on havaittu, kun ekstrapolointimenetelmää käytetään väärin.

Esimerkiksi monet tutkimukset osoittavat, että seksuaalisen aloitteen ikä pienenee ajan myötä länsimaissa. Katso tontti, joka on alle yhdynnän ikää Yhdysvalloissa. Jos käytämme sokeasti lineaarista regressiota ensimmäisen yhdynnän iän ennustamiseksi, ennustamme sen menevän nollan alapuolelle tietyinä vuosina (vastaavasti ensimmäisen avioliiton ja ensimmäisen syntymän tapahtuessa jonkin aikaa kuoleman jälkeen) … yhden vuoden ennuste eteenpäin, luulisin, että lineaarinen regressio johtaisi melko tarkkoihin lyhyen aikavälin ennusteisiin trendille.

kirjoita kuvan kuvaus tähän

(lähde guttmacher.org )

Toinen hieno esimerkki tulee täysin toisesta verkkotunnuksesta, koska kyseessä on ” ” ekstrapolointi Microsoft Excelin suorittamaan testiin, kuten alla on esitetty (En tiedä, onko tämä jo korjattu vai ei). En tiedä tämän kuvan kirjoittajaa, se on peräisin Giphy : stä.

kirjoita kuvan kuvaus tähän

Kaikki mallit ovat vääriä , ekstrapolointi on myös väärä, koska se ei mahdollistaisi tarkkojen ennusteiden tekemistä. Muiden matemaattisten / tilastollisten työkalujen avulla voit tehdä likimääräisiä ennusteita. Kuinka tarkkoja ne ovat, riippuu omistamiesi tietojen laadusta, ongelmallesi sopivien menetelmien avulla, mallisi määrittelyssä tekemistäsi oletuksista ja monista muista tekijöistä. Mutta tämä ei tarkoita, ettemme voi käyttää tällaisia menetelmiä. Voimme, mutta meidän on muistettava heidän rajoituksistaan, ja meidän tulisi arvioida niiden laatu tietylle ongelmalle.

Kommentit

  • Kun regressioon käyttämäsi tieto päättyy 1980-luvun alussa, voit todennäköisesti helposti testata, kuinka kauan kyseisen päivämäärän jälkeen ekstrapolointi toimisi.
  • @gerrit Olen samaa mieltä, mutta valitettavasti en voinut ’ löytää sopivia tietoja. Mutta jos joku voisi osoittaa sen minulle, ’ päivitän mielelläni vastaukseni tällaista vertailua varten.
  • Tässä tapauksessa ekstrapolointi epäonnistuu, koska ensimmäisen sukupuolen ikä on noussut viime vuosina. (Mutta tätä koskevat tiedot viivästyttävät syntymävuotta aina parilla vuosikymmenellä syistä, joiden pitäisi olla ilmeisiä.)

Vastaa

Pidän aivan Nassim Talebin esimerkistä (joka oli mukautus Bertrand Russellin aikaisempaan esimerkkiin):

Harkitse kalkkunaa, joka on ruokitaan joka päivä. Jokainen ruokinta vahvistaa linnun uskoa siihen, että ihmissuvun ystävälliset jäsenet ruokkivat päivittäin ruokasääntöjä, jotka ”katsovat sen etuja”, kuten poliitikko sanoisi. kiitospäivää edeltävänä keskiviikkona kalkkunalle tapahtuu jotain odottamatonta. Se muuttaa uskomusta.

Jotkut matemaattiset analogit ovat seuraavat:

  • Funktion ensimmäisten Taylor-kertoimien tuntemus ei aina takaa, että seuraavat kertoimet seuraavat oletettua malliasi.

  • tieto differentiaaliyhtälön alkuperäiset olosuhteet eivät aina takaa tietoa sen asymptoottisesta käyttäytymisestä (esim. Lorenzin yhtälöt, joskus vääristyneet ns. ”perhosvaikutukseksi”)

Tässä on hieno MO-ketju .

kommentit

  • … ja tietysti Talebin on mainittava moraalinen oppitunti: ” älä ’ ole kalkkuna ”! Tässä yhteydessä: don ’ t olla huolimaton ekstrapolaattori, äläkä ’ anna periksi hubrisin synnille.
  • @ uoɥʇʎPʎzɐɹC, minua ei ollut ’ t pyydä sitä, mutta kiitos!
  • Don ’ ei todellakaan ole hyötyä ristivalidoidusta maineesta – eikä kukaan nähnyt vastaustasi ja se oli todella hyvä. Nauti!

Vastaa

Mieti seuraavaa tarinaa, jos haluat.

I Muista myös istua tilastokurssilla, ja professori kertoi meille, että ekstrapolointi oli huono idea. Sitten seuraavan luokan aikana hän kertoi meille, että se oli taas huono idea; itse asiassa hän sanoi sen kahdesti.

Olin sairas loppukauden ajan, mutta olin varma, etten voinut unohtaa paljon materiaalia, koska viime viikolla kaverilla on varmasti oltava ei ole tehnyt muuta kuin kertonut ihmisille yhä uudestaan, kuinka ekstrapolointi oli huono idea.

Kummallista kyllä, en saanut kovin korkeita tuloksia tentissä.

Kommentit

  • Kysymyksellä kysytään ” mitä ekstrapoloinnissa on vikaa? ”. Etsimme vastauksia, jotka antavat syyn sille, miksi ekstrapolointi voi olla huono idea.
  • @RobertLong: Se ’ on oikeastaan eräänlainen meta / vitsivastaus, ja melko samanlainen kuin xkcd.com/605 – silti ehkä parempi kommenttina kuin vastauksena.
  • @NeilSlater: Sinun olisi pitänyt lähettää kommenttisi vastauksena … 🙂
  • @RobertLong: Tämä on sellainen vastaus. Se on yksinkertaisesti vertauksen muotoinen.
  • Ei ole selvää, että mallisi on eksponentiaalinen.

Vastaa

Kysymys ei ole vain tilastollinen, se on myös epistemologinen. Ekstrapolointi on yksi tapa oppia luonnosta, se on -induktio . Sanotaan, että meillä on tietoa materiaalin sähkönjohtavuudesta välillä 0 – 20 celsiusastetta, mitä voimme sanoa johtavuudesta 40 celsiusasteessa?

Se liittyy läheisesti pieniin otoksen päätelmä: mitä voimme sanoa koko populaatiosta pienestä näytteestä tehdyistä mittauksista? Tämän aloitti Gosset as Guiness , joka keksi opiskelijoiden t-jakelut. Ennen häntä tilastotieteilijät eivät vaivaudu miettimään pieniä näytteitä olettaen, että otoksen koko voi aina olla suuri. Hän oli Guinnesissa ja joutui käsittelemään oluenäytteitä päättääkseen, mitä tehdä koko lähetettävän oluen erän kanssa. p>

Joten käytännössä (liike), tekniikan ja tieteen alalla meidän on aina ekstrapoloitava jollakin tavalla. Se voi olla pienten näytteiden ekstrapolointi suuriksi tai rajallinen syöttöolosuhteiden laajempi joukko ehtoja, alkaen mitä kiihdyttimessä tapahtuu, mitä tapahtui mustalle aukolle miljardien mailien päässä jne. Se on kuitenkin erityisen tärkeää tieteessä, kuten opimme todellakin tutkimalla ekstrapolointiarvioidemme ja todellisten mittausten välisiä ristiriitoja. Löydämme usein uusia ilmiöt, kun ristiriidat ovat suuria tai johdonmukaisia.

Siksi sanon, että ekstrapoloinnissa ei ole ongelmaa. Se on jotain, joka meidän on tehtävä joka päivä. Se on vain vaikeaa.

Vastaus

Itse ekstrapolointi ei ole välttämättä paha, mutta se on prosessi, joka soveltuu johtopäätökset, jotka ovat kohtuuttomampia kuin interpoloinnilla.

  • Ekstrapolointi tehdään usein tutkimaan arvoja melko kaukana näytteistetystä alueesta. Jos otan 100 arvoa 0-10: stä ja ekstrapoloin sitten vain vähän, vain 11: een, uusi pisteeni on todennäköisesti 10 kertaa kauempana datapisteestä kuin mikä tahansa interpolointi voisi koskaan saada. Tämä tarkoittaa, että että paljon enemmän tilaa muuttujalle päästä käsistä (laadullisesti). Huomaa, että valitsin tarkoituksella vain pienen ekstrapoloinnin. Se voi pahentua huomattavasti
  • Ekstrapolointi on tehtävä käyrän sovituksilla, jotka oli tarkoitettu ekstrapoloimiseen. Esimerkiksi monet polynomi-sovitukset ovat erittäin huonoja ekstrapoloinnille, koska termit, jotka käyttäytyvät hyvin näytealueella, voivat räjähtää, kun poistut siitä. Hyvä ekstrapolointi riippuu ”hyvästä arvauksesta” siitä, mitä tapahtuu näytteellisen alueen ulkopuolella. Mikä vie minut …
  • Ekstrapolointia on usein erittäin vaikeaa vaihesiirtymien vuoksi. Monilla prosesseilla, joita voidaan haluta ekstrapoloida, on selvästi epälineaarisia ominaisuuksia, joita ei ole riittävästi altistettu näytteelliselle alueelle. Äänenopeuden ympärillä oleva ilmailu on erinomainen esimerkki. Monet ekstrapolaatiot pienemmistä nopeuksista hajoavat, kun saavutat ja ylität tiedonsiirtonopeuden ilmassa.Tämä tapahtuu melko usein myös pehmeiden tieteiden kohdalla, jolloin itse politiikka voi vaikuttaa politiikan onnistumiseen. Keynesiläinen taloustiede ekstrapoloi talouden käyttäytymisen eri inflaatiotasoilla ja ennusti parhaan mahdollisen tuloksen. Valitettavasti oli toisen asteen vaikutuksia, ja tulos ei ollut taloudellinen vauraus, vaan pikemminkin Yhdysvaltojen korkein inflaatioaste.
  • Ihmiset pitävät ekstrapolaatioista. Yleisesti ottaen ihmiset todella haluavat jonkun vertaavan kristallipalloon ja kertovan heille tulevaisuuden. He hyväksyvät yllättävän huonot ekstrapolaatiot yksinkertaisesti siksi, että ne ovat kaikki heidän hallussaan olevat tiedot. Tämä ei välttämättä tee sinänsä ekstrapoloinnista huonoa, mutta se on ehdottomasti jokin, joka on otettava huomioon käytettäessä sitä.

Lopullisen ekstrapoloinnin kannalta katsotaan Manhattan-projekti. Siellä olevat fyysikot joutuivat työskentelemään erittäin pienikokoisilla testeillä ennen todellisen rakentamista. Heillä ei yksinkertaisesti ollut tarpeeksi uraania tuhlata testeihin. He tekivät parhaansa ja älykkäitä. Viimeisen kokeen tapahtuessa päätettiin kuitenkin, että jokainen tutkija päättää, kuinka kaukana räjähdyksestä he haluavat olla, kun se alkaa. Siellä oli huomattavia mielipide-eroja siitä, kuinka kaukana oli ”turvallista”, koska jokainen tutkija tiesi ekstrapoloivansa melko kaukana testeistään. Oli jopa ei-triviaalinen näkökohta siitä, että he saattavat sytyttää ilmakehän ydinpommilla, ja tämä kysymys asetettiin myös huomattavaan ekstrapolaatioon!

Vastaus

Paljon hyviä vastauksia täällä, haluan vain kokeilla ja syntetisoida asia, jonka näen ongelman ytimenä: on vaarallista ekstrapoloida sen datanmuodostusprosessin ulkopuolelle, joka johti arviointinäytteeseen. Tätä kutsutaan joskus ”rakennemuutokseksi”.

Ennustaminen sisältää oletuksia, joista tärkein on, että tietojen tuottamisprosessi on (niin lähellä kuin siinä ei ole merkittävää eroa) sama kuin otoksen luonut prosessi (lukuun ottamatta rhs-muuttujia, joiden muutoksia teet nimenomaisesti huomioon mallissa). Jos tapahtuu rakenteellinen muutos (eli kiitospäivä Talebin esimerkissä), kaikki vedot ovat pois päältä.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *