” Lényegében minden modell téves, de néhány hasznos. “

— Box, George EP; Norman R. Draper (1987). Empirikus modellépítő és válaszfelületek, p. 424, Wiley. ISBN 0471810339.

Mit jelent pontosan a fenti kifejezés?

Megjegyzések

  • Ugyanazon könyvről korábban már volt szó: Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful. Talán ez hasznosabb.

Válasz

Úgy gondolom, hogy a jelentését úgy lehet a legjobban elemezni, ha két részből áll:

“Minden modell téves”, vagyis minden modell téves, mert ez a valóság egyszerűsítése. Néhány modell, különösen a “kemény” tudományokban, csak egy kicsit téved. Nem vesznek figyelembe olyan dolgokat, mint a súrlódás vagy az apró testek gravitációs hatása. Más modellek sokat tévednek – nagyobb dolgokat nem vesznek figyelembe. A társadalomtudományokban sokat figyelmen kívül hagyunk.

“De néhány hasznos” – a valóság egyszerűsítése nagyon hasznos lehet. Segíthetnek elmagyarázni, megjósolni és megérteni az univerzumot és annak minden különféle elemét.

Ez nem csak a statisztikákban igaz! A térképek egyfajta modellek; tévednek. De a jó térképek nagyon hasznosak. Példák vannak más hasznos, de helytelen modellekre.

Megjegyzések

  • +1 Mert tetszik a térképek analógiája. Én ‘ a jövőben is használom!
  • Sok modell a ” hard ” tudományokban is meglehetősen messze van (tegnap vettem részt egy szemináriumon, ahol a hibasoron belül volt, de a hibasáv két nagyságrenddel volt).
  • +1. Úgy gondolom, hogy a kulcsmondata ” minden modell hibás, mert az a valóság leegyszerűsítése “. Az emberek ezt gyakran elfelejtik – például a gazdaság naiv kritikája során (vannak saját kritikáim, de kifinomultabbaknak kell lenniük, mint csak az, hogy ” a valóság összetettebb, mint a modellje “). Ha nem tennénk t leegyszerűsíteni, nyers valósága van, amely túl bonyolult ahhoz, hogy megértsük. Tehát le kell egyszerűsítenünk, hogy bármilyen betekintést nyerjünk.
  • A tökéletes térkép fantáziáját 1: 1 méretarányban számos szerző felhasználta, többek között Lewis Carroll, Jorge Luis Borges és Umberto Eco. Valójában nem lenne haszna, mert szükségszerűen csak bonyolult lenne, mivel az általa feltérképezett terület, és nem könnyebb megérteni (nem beszélve a kibontás és az olvasásra való kihelyezés kínosságáról).
  • Talán hozzáteszi azt is, hogy egy modellnek kissé tévesnek kell lennie nek, mert különben nem általánosítana és így máshol nem lenne alkalmazható. Van néhány válasz, amely ezt lejjebb mondja. De ma már túl sok válasz van ahhoz, hogy mindet elolvashassa.

Válasz

Ez azt jelenti, hogy hasznos betekintést lehet nyújtani olyan modellekből, amelyek nem tökéletesen reprezentálják az általuk modellezett jelenségeket.

A statisztikai modell a matematikai fogalmakat használó rendszer leírása. Mint ilyen, sok esetben hozzáad egy bizonyos absztrakciós réteget a következtetési eljárás megkönnyítése érdekében (pl. Mérési hibák normalitása, összetett szimmetria a korrelációs struktúrákban stb.). szinte lehetetlen, hogy egyetlen modell tökéletesen leírjon egy valós világjelenséget, mivel önmagunknak szubjektív a világképe (érzékszervünk nem tökéletes); ennek ellenére sikeres statisztikai következtetések történnek, mivel világunk bizonyos fokú következetességgel rendelkezik, amelyet kihasználunk. Tehát a szinte mindig rossz modelljeink hasznosnak bizonyulnak.

(Biztos vagyok benne, hogy hamarosan nagy merész választ fog kapni, de igyekeztem tömör lenni erről!)

Megjegyzések

  • Mondhatjuk, hogy ezek a hasznos modellek hozzávetőleges megoldásokat kínálnak?
  • @gpuguy : Biztos, hogy tudsz. John Tukey-t idézve: An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem. (valójában a JT ‘ idézet elképesztően éleslátó.)
  • ” Sokkal jobb egy hozzávetőleges válasz a helyes kérdésre, amely gyakran homályos, mint a helytelen kérdésre adott pontos válasz, amelyet mindig pontosítani lehet. ” John W. Tukey 1962 Az adatelemzés jövője. Annals of Mathematical Statistics 33: 1-67 (lásd 13-14. oldal) Kétségtelen, hogy máskor is hasonlót mondott, de hogy ‘ s a szokásos forrás.
  • Másoltam az enyémet az eredeti kiadványból.

Válasz

Ezt megtaláltam Thad Tarpey 2009-es JSA-beszélgetése hasznos magyarázattal és kommentárral szolgál a Box passzusról.Azt állítja, hogy ha a modelleket az igazság közelítésének tekintjük, ugyanolyan könnyen nevezhetnénk az összes modellt helyesnek.

Íme az absztrakt:

A statisztikai hallgatók gyakran megismerkednek George Box híres idézetével: „minden modell hibás, néhány hasznos.” Ebben a beszélgetésben azt állítom, hogy ez az idézet, bár hasznos, helytelen. Más és pozitívabb perspektíva annak elismerése, hogy a modell egyszerűen eszköze az érdekes információk kinyerésének az adatokból. Az igazság végtelenül összetett, és a modell csupán közelítése az igazsághoz. Ha a közelítés gyenge vagy félrevezető, akkor a modell haszontalan. Ebben a beszélgetésben példákat adok olyan helyes modellekre, amelyek nem igaz modellek. Ábrázolom, hogyan vezethet a „helytelen” modell fogalma rossz következtetésekhez.

Válasz

Mivel senki sem adta hozzá, George Box az idézett fázist használta a könyv következő szakaszának bevezetésére. Úgy gondolom, hogy a lehető legjobban elmagyarázza, mire gondolt:

Most nagyon figyelemre méltó lenne, ha a való világban létező bármely rendszer képes lenne pontosan bármely egyszerű modell képviseli. A ravaszul megválasztott parsimonious modellek azonban gyakran feltűnően hasznos közelítéseket nyújtanak. Például a $ PV = RT $ törvény $ P $ , volume $ V $ és hőmérséklet $ T $ egy ” ideális ” gáz az állandó $ R $ segítségével nem teljesen igaz egyetlen valódi gázra sem, de gyakran hasznos közelítést nyújt, és szerkezete informatív, mivel fizikai szempontból származik a gázmolekulák viselkedéséből.

Egy ilyen modellhez nem kell feltenni a kérdést ” Igaz-e a modell ? “. Ha az ” igazság ” az ” teljes igazság, akkor ” a válasz ” nem lehet “. Az egyetlen érdekes kérdés: ” Világító és hasznos a modell? “.

Box, GEP (1979 ), ” Robusztusság a tudományos modellépítés stratégiájában “, Launer, RL; Wilkinson, GN, Robustness in Statistics , Academic Press, 201–236. O.

Válasz

Számomra a tényleges meglátás a következő szempontban rejlik:

A modellnek nem kell legyen helyes, hogy hasznos legyen.

Sajnos sok tudományban gyakran elfelejtik, hogy a modelleknek nem feltétlenül kell a valóságot pontosan reprezentálniuk, hogy új felfedezéseket tegyenek lehetővé. és jóslatok!

Tehát ne pazarolja az idejét egy olyan bonyolult modell felépítésével, amelyhez a változók sokaságának pontos mérésére van szükség. Az igazi zseni egy egyszerű modellt talál ki, amely elvégzi a munkát.

Válasz

A modell nem tud 100% -ig pontos előrejelzést adni, ha véletlenszerűség van az eredményekben. Ha nem volt bizonytalanság, véletlenszerűség és hiba, akkor inkább ténynek, mint modellnek tekintenék. Az első nagyon fontos, mert a modellek gyakran a nem bekövetkezett események elvárásainak modellezésére használják. Ez szinte garantálja, hogy van némi bizonytalanság a valós eseményekkel kapcsolatban.

Tökéletes információk birtokában elméletileg lehetséges lehet olyan modell létrehozása, amely tökéletes előrejelzést ad az ilyen pontosan ismert eseményekről. E valószínűtlen körülmények ellenére azonban egy ilyen modell annyira összetett lehet, hogy számításilag nem kivitelezhető, és csak egy adott pillanatban lehet pontos, mivel más tényezők megváltoztatják az értékek változását az események során.

Mivel a bizonytalanság és a véletlenszerűség jelen van a legtöbb valós adatban, a tökéletes modell megszerzésére irányuló erőfeszítések hiábavalóak. Ehelyett értékesebb egy elég pontos modell megszerzését vizsgálni, amely elég egyszerű ahhoz, hogy mind az adatok, mind a felhasználásukhoz szükséges számítás szempontjából használható legyen. Noha ezek a modellek köztudottan tökéletlenek, ezek közül a hibák közül néhány jól ismert, és figyelembe vehető a modellek alapján történő döntéshozatalban.

Az egyszerűbb modellek tökéletlenek lehetnek, de könnyebben megindokolhatók , összehasonlítani egymással, és könnyebben lehet vele dolgozni, mert valószínűleg kevésbé lesznek számítási szempontból igényesek.

Válasz

Ha szabad, csak egy további megjegyzés hasznos lehet. A prase általam kedvelt verziója

(…) az összes modell közelítő. Lényegében minden modell téves, de néhány hasznos (…)

a Válaszfelületek, keverékek és gerincelemzések ből származik, Box and Draper (2007, 414. o., Wiley) . A kibővített idézetet megnézve egyértelműbb, hogy mit jelentett a Box – a statisztikai modellezés a valóság közelítéséről szól, és a közelítés soha nem pontos, tehát a leg legmegfelelőbb közelítés megtalálásáról szól. . Ami az Ön céljának megfelel, az egy szubjektív dolog, ezért nem a modellek egyike hasznos, hanem a modellezés céljától függõen némelyikük

Válasz

Lehet, hogy így gondolja. egy objektum maximális bonyolultsága (azaz entrópiája) engedelmeskedik a Bekenstein kötött valamilyen formájának:

$$ I \ le \ frac { 2 \ pi RE} {\ hbar c \ ln 2} $$

ahol $ E $ a teljes nyugalmi energia, beleértve a tömeget, és $ R $ az objektumot körülvevő gömb sugara.

Ez nagy szám, a legtöbb esetben:

A bekensteini kötés egy átlagos emberi agy esetében $ 2,58991 · 10 ^ {42} $ bit lenne, és az információk felső határát jelenti az átlagos emberi agy kvantumszintig történő tökéletes újrateremtéséhez. Ez azt jelenti, hogy a különböző állapotok száma Az emberi agy (és az elme, ha igaz a fizikalizmus) ($ Ω = 2 ^ I $) legfeljebb 107,79640 $ 10 ^ {41} $.

Tehát a “legjobb térképet” akarja használni, azaz magát a területet, minden hullámegyenlettel minden sejt összes részecskéjére? Abszolút nem. Nem csak számítási katasztrófa lenne, de olyan dolgokat modelleznél, amelyeknek alapvetően semmi közük lehet ahhoz, ami érdekel. Ha csak annyit akar tenni, hogy mondjuk azonosítja, hogy ébren vagyok-e vagy sem, akkor nem kell tudnia, mit csinál a # 32458 elektron a neuron # 844030 riboszóma # 2305 # 2 molekulájában. Ha ezt nem modellezi, akkor a modellje valóban „téves”, de ha azonosítani tudja, hogy ébren vagyok-e vagy sem, akkor a modellje mindenképpen hasznos.

Válasz

Azt hiszem, Peter és a user11852 nagyszerű válaszokat adott. Azt is hozzátenném (tagadással), hogy ha egy modell nagyon jó lenne, akkor valószínűleg a felesleges felszerelés miatt haszontalan lenne (ezért nem általánosítható).

Megjegyzések

  • +1 a túlillesztés pontjához. Az olyan algoritmusok, mint a Naive Bayes és a lineáris diszkrimináns elemzés, gyakran nagyon jól működnek, még akkor is, ha tudod, hogy az alapul szolgáló modell helytelen (pl. Spamszűrés), egyszerűen azért, mert kevesebb adatra van szükség a paraméterek becsléséhez.

Válasz

Sajátos értelmezésem a következő: Ha azt gondolnám, hogy egy matematikai modell pontosan leírja az összes tényezőt és kölcsönhatásukat, akkor az érdekes jelenség irányítása túl egyszerű lenne és arrogáns. Azt sem tudjuk, hogy az általunk használt logika elegendő-e univerzumunk megértéséhez. Néhány matematikai modell azonban elég jó közelítést jelent (a tudományos módszer szempontjából), amely hasznos következtetések levonására az ilyen jelenségről.

Válasz

Asztrosztatikusként (talán ritka fajta) a Box dictum hírnevét sajnálatosnak tartom. A fizikai tudományokban gyakran erőteljes egyetértésünk van a megfigyelt jelenség hátterében álló folyamatok megértésében, és ezeket a folyamatokat gyakran kifejezhetik a gravitáció, a kvantummechanika, a termodinamika stb. törvényeiből fakadó matematikai modellek. A statisztikai célkitűzések a legjobban illeszkedő modellparaméterek fizikai tulajdonságainak, valamint a modellválasztás és validálás megbecsülése. az Európai Űrügynökség “s Planck műhold ” kozmikus mikrohullámú hátterének méréséről szóló 2013. márciusi kiadványból, amely meggyőzően megalapozza az egyszerű 6 paraméteres LambdaCDM “modell a Big Ba számára ng. Kétlem, hogy a Box dictum-ja bárhol alkalmazható lenne a fejlett statisztikai módszerek széles skáláján, amelyeket ebben a 29 cikkben használnak.

Válasz

Most fogalmaztam meg a fenti választ azzal, hogy a folyamatmodelleket fókuszpontnak tekintem. Az állítás a következőképpen értelmezhető:

“Minden modell téves”, vagyis minden modell téves, mert ez a Néhány modell csak egy kicsit hibás. Néhány dolgot figyelmen kívül hagy, például: -> a követelmények megváltoztatása, -> a projekt határidőn belüli befejezésének figyelmen kívül hagyása, -> nem veszi figyelembe az ügyfél kívánt minőségi szintjét stb. … Más modellek sokat tévednek – figyelmen kívül hagyják a nagyobb dolgokat. A klasszikus szoftveres folyamatmodellek sokat figyelmen kívül hagynak az agilis folyamatmodellekkel szemben, amelyek kevésbé vesznek figyelembe.

“De némelyik hasznos” – a valóság egyszerűsítése nagyon hasznos lehet. Segíthetnek elmagyarázni, megjósolni és megérteni a teljes projektet és annak minden összetevõjét. A modelleket azért használják, mert jellemzőik megfelelnek a legtöbb szoftverfejlesztő programnak.

Válasz

Szeretnék még egy értelmezést adni a “hasznos” kifejezésről. Valószínűleg nem arra gondolt, amire Box gondolt.

Amikor döntéseket kell hoznia, és erre végül felhasználják az összes információt, akkor valamilyen formában meg kell mérnie a sikerét. Amikor bizonytalan információkkal rendelkező döntésekről beszélünk, ezt az intézkedést gyakran hasznosságnak hívják.

Tehát a hasznos modellekre is gondolhatunk, mint olyanokra, amelyek megalapozottabb döntéseket hoznak számunkra; hogy célkitűzéseinket hatékonyabban érjük el.

Ez egy újabb dimenzióval bővíti a szokásos kritériumokat, például egy modell képességét arra, hogy valamit helyesen megjósoljon: Ez lehetővé teszi számunkra, hogy mérlegeljük a modell különböző aspektusait egyéb.

Válasz

“Minden modell hibás, de néhány hasznos”. Talán ez azt jelenti: A lehető legjobban kellene cselekednünk azzal, amit tudunk, + új tanulásra kell törekednünk?

Megjegyzések

  • (-1) Tudna-e bármilyen utalást adni arra, hogy a G.E.P. Box ezt jelentette? Amint a többi válaszból kiderül, valami egészen mást értett.
  • Az OP talán az idézetet veszi át, és új értelmezést ad neki. Egyetértek Timmel abban, hogy Box többé-kevésbé azt mondta, hogy ne vegye a modellt a valóság pontos értelmezésének, de elismerik, hogy valamilyen modell jól leírhatja az adatokat.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük