Hogyan számíthatom ki a relatív hibát, ha az igazi érték nulla?
Mondjuk, hogy $ x_ {true} = 0 $ van és $ x_ {test} $. Ha a relatív hibát a következőképpen definiálom:
$ \ text {relatív hiba} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $
Akkor a relatív hiba mindig nincs meghatározva. Ha ehelyett a következő meghatározást használom:
$ \ text {relatív hiba} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $
Akkor a relatív hiba mindig 100%. Mindkét módszer haszontalannak tűnik. Van-e más alternatíva?
Megjegyzések
- Pontosan ugyanaz a kérdés merült fel bennem a paraméterek torzításával kapcsolatban Monte Carlo-szimulációkban, az első definícióval. Az egyik paraméterértékem 0 volt, ezért nem számoltam ‘ ehhez a paraméterhez a paraméterek elfogultságát …
- A megoldás az, hogy nem használunk relatív hibát a ebben az esetben.
Válasz
Számos alternatíva létezik , a céltól függően.
Gyakori a laboratóriumi minőség-ellenőrzési eljárásokban alkalmazott “relatív százalékos különbség” (RPD). Bár sok látszólag eltérő képletet találhat, ezek mindegyikében két érték különbségét hasonlítják össze az átlagos nagyságukkal:
$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$
Ez egy aláírt kifejezés, pozitív, ha $ x $ meghaladja a $ y $ -ot, és negatív, ha $ y $ meghaladja a $ x $ -ot. Értéke mindig $ -2 $ és $ 2 $ között van. Az abszolút értékek nevezőben történő felhasználásával ésszerű módon kezeli a negatív számokat. A legtöbb általam megtalált referencia, például a New Jersey DEP webhely-helyreállítási program adatminőség-értékelése és az adatok használhatóságának értékelése technikai útmutató a $ d_1 abszolút értékét használja $, mert csak a relatív hiba nagysága érdekli őket.
A Wikipédia cikk a relatív változás és különbség em témáról > megállapítja, hogy
$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$
gyakran használják relatív tolerancia tesztként lebegőpontos numerikus algoritmusokban. Ugyanez a cikk rámutat arra is, hogy az olyan képletek, mint a $ d_1 $ és a $ d_ \ infty $, általánosíthatók a következőre:
$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$
ahol az $ f $ függvény közvetlenül függ a $ x $ és $ y $ nagyságától (általában feltételezve, hogy $ x $ és $ y $ pozitív). Példaként megadja a max, a min és a számtani átlagukat (a $ x $ és $ y $ abszolút értékek felvételével és anélkül is), de másféle átlagokat is fel lehet fontolni, például a $ \ sqrt {| xy geometriai átlagot |} $, a harmonikus átlag $ 2 / (1 / | x | + 1 / | y |) $ és $ L ^ p $ jelentése $ ((| | x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ megfelel $ p = 1 $ -nak, és $ d_ \ infty $ megfelel a limitnek, mivel $ p \ to \ infty $.) Lehet választani egy $ f $ -ot a $ x $ és $ várható statisztikai viselkedése alapján. y $. Például megközelítőleg lognormális eloszlások esetén a geometriai átlag vonzó választás lenne $ f $ számára, mivel ebben az esetben értelmes átlag.
A képletek többsége nehézségekbe ütközik, ha a nevező egyenlő nulla. Sok alkalmazásban vagy nem lehetséges, vagy ártalmatlan a különbség nullára állítása, amikor $ x = y = 0 $.
Ne feledje, hogy mind ezek a definíciók alapvető változatlanságot mutatnak tulajdonság: bármi is lehet a $ d $ relatív különbségfüggvény, ez nem változik, ha az argumentumokat egyenletesen skálázza a $ \ lambda \ gt 0 $:
$$ d (x, y) = d ( \ lambda x, \ lambda y). $$
Ez a tulajdonság lehetővé teszi számunkra, hogy a $ d $ -ot relatív különbségnek tekintjük. Így különösen egy nem invariáns függvény, például
$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$
egyszerűen nem minősül. Bármilyen erénye is lehet, nem fejez ki relatív különbséget.
A történet itt nem ér véget. Még gyümölcsözőnek is találhatjuk, ha az invariancia következményeit egy kicsit tovább toljuk.
A az összes rendezett valós számpár $ (x, y) \ ne (0,0) $ ahol $ (x, y) $ azonosnak tekintendő $ (\ lambda x, \ lambda y) $ a Valódi vetítővonal $ \ mathbb {RP} ^ 1 $. Mind a topológiai, mind az algebrai értelemben a $ \ mathbb {RP} ^ 1 $ egy kör. Bármely $ (x, y) \ ne (0,0) $ egyedi sort határoz meg a $ (0,0) $ origón keresztül. Amikor $ x \ ne 0 $, a meredeksége $ y / x $; különben lejtését “végtelennek” (és negatívnak vagy pozitívnak) tekinthetjük. Ennek a függőleges vonalnak a szomszédsága rendkívül nagy pozitív vagy rendkívül nagy negatív lejtésű vonalakból áll. Az összes ilyen sort a $ \ theta = \ arctan (y / x) $ szög szerint paraméterezhetjük, a $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $ értékkel.Minden ilyen $ \ theta $ -hoz társítva van egy pont a körön,
$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ balra (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ jobbra). $$
Bármely, a körön meghatározott távolság tehát felhasználható a relatív különbség meghatározására.
Például vegye figyelembe a körön a szokásos (euklideszi) távolságot, ahol a két pont közötti távolság a közöttük lévő szög nagysága. A relatív különbség akkor a legkevesebb, ha $ x = y $, ami megfelel $ 2 \ theta = \ pi / 2 $ (vagy $ 2 \ theta = -3 \ pi / 2 $, ha $ x $ -nak és $ y $ -nak ellentétes előjelei vannak). Ebből a szempontból a $ x $ és $ y $ pozitív számok természetes relatív különbsége lenne a távolság ettől a szögetől:
$$ d_S (x, y) = \ left | 2 \ arctan \ balra (\ frac {y} {x} \ jobbra) – \ pi / 2 \ jobbra.. $$
Első sorrendben ez a relatív távolság $ | xy | / | y | $ – -de akkor is működik, ha $ y = 0 $. Ráadásul nem robbant fel, hanem (mint előírt távolság) $ – \ pi / 2 $ és $ \ pi / 2 $ között korlátozott, amint ez a grafikon jelzi:
Ez arra utal, hogy mennyire rugalmasak a választások a relatív különbségek mérésének módjának kiválasztásakor.
Hozzászólások
- Köszönöm az átfogó választ, szerinted mi a legjobb hivatkozás erre a sorra: ” gyakran használják relatív tolerancia tesztként lebegőpontos numerikus algoritmusokban. Ugyanez a cikk rámutat arra is, hogy a d1d1 és a d∞d∞ képletek általánosíthatók ”
- @Hammad Követte a Wikipedia cikk linkjét?
- Igen! Megnéztem a Wikipédiát; azt hiszem, hogy ‘ s nem tényleges hivatkozás (ez a sor is hivatkozás nélkül található a wikiben)
- btw, soha nem találtam erre akadémiai hivatkozást 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
- @KutalmisB Köszönjük, hogy észrevette, hogy: a ” min ” egyáltalán nem tartozik ‘. Úgy tűnik, hogy ez egy bonyolultabb képlet lehet, amely kezelte a $ x $ és $ y $ összes lehetséges jeleit, amelyeket később egyszerűsítettem. Eltávolítottam.
Válasz
Először vegye figyelembe, hogy a relatív érték kiszámításakor általában az abszolút értéket veszi figyelembe hiba.
A probléma gyakori megoldása a számítás
$$ \ text {relatív hiba} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ bal | x _ {\ text {true}} \ right |}. $$
Megjegyzések
- Ez problémás, mivel az értékekhez választott mértékegységektől függően változik.
- Ez ‘ s teljesen igaz. Ez nem ‘ tökéletes megoldás a problémára, de ez egy általános megközelítés, amely meglehetősen jól működik, ha a $ x $ jól méretezett.
- Tudna részletezni a válaszod arra, hogy mit értesz ” jól méretezett ” alatt? Tegyük fel például, hogy az adatok 0–0,00 0001 dollár / mol közötti liter koncentrációra tervezett vizes kémiai mérőrendszer kalibrálásából származnak, amely mondjuk három jelentős számjegy pontosságát képes elérni. Az Ön ” relatív hibája ” ezért folyamatosan nulla lenne, kivéve a nyilvánvalóan hibás méréseket. Ennek fényében pontosan hogyan méretezné át az ilyen adatokat?
- Példája az, ahol a változó nem ‘ méretezhető. A ” jól méretezett ” kifejezésen azt értem, hogy az a változó úgy van méretezve, hogy kis tartományban (például párban) vegye fel az értékeket nagyságrendek) közel 1. Ha a változó sok nagyságrendet meghaladó értékeket vesz fel, mint ön ‘ komolyabb méretezési problémákat vet fel, és ez az egyszerű megközelítés nem ‘ nem lesz megfelelő.
- Van utalás erre a megközelítésre? A módszer neve? Köszönöm.
Válasz
A MAPE megkeresése,
Ez nagyon vitatható téma, és sok opensource közreműködő tárgyalt a fenti témáról. Az eddigi leghatékonyabb megközelítést a fejlesztők követik. További információkért olvassa el ezt a PR .
Válasz
Egy ideig zavart voltam ebben. Végül azért, mert ha a relatív hibát nullához viszonyítva próbálod megmérni, akkor olyasmit próbálsz erőltetni, ami egyszerűen nem létezik.
Ha belegondol, összehasonlítja az almát a narancssal, amikor összehasonlítja a relatív hibát a nullától mért hibával, mert a nulláról mért hiba egyenértékű a mért értékkel (ezért kapjon 100% -os hibát, ha elosztja a tesztszámmal).
Például vegye figyelembe a nyomásmérés (a légköri relatív nyomás) és az abszolút nyomás mérési hibáját. Tegyük fel, hogy műszerrel mérjük a mérőnyomást tökéletes légköri körülmények között, és a készülék mért a légköri nyomásfolton, hogy 0% -os hibát rögzítsen. A megadott egyenlet felhasználásával, és először feltételezve, hogy a mért nyomásértéket használtuk a relatív hiba kiszámításához: $$ \ text {relatív hiba} = \ frac {P_ {gauge, true} – P_ {gauge, test}} {P_ {gauge, true}} $$ Majd $ P_ {gauge, true} = 0 $ és $ P_ {gauge, test} = 0 $ és nem kap 0% -os hibát, ehelyett ez nincs meghatározva. Ennek oka, hogy a tényleges százalékos hibának az abszolút nyomásértékeket kell használnia, mint ez: $$ \ text {relatív hiba} = \ frac {P_ {abszolút, igaz} -P_ {abszolút, teszt}} {P_ {abszolút, igaz}} $$ most $ P_ {abszolút, igaz} = 1atm $ és $ P_ {abszolút, teszt} = 1atm $ , és 0% -os hibát kap. Ez a relatív hiba helyes alkalmazása. Az eredeti alkalmazás, amely a nyomásmérőt használta, inkább hasonlított a “relatív érték relatív hibájára”, ami más dolog, mint a “relatív hiba”. A relatív hiba mérése előtt abszolút értékre kell átalakítania a mérőnyomást.
A kérdésre az a megoldás, hogy megbizonyosodjon arról, hogy abszolút értékekkel van dolga a relatív hiba mérésekor, így a nulla nem lehetséges. Akkor valóban relatív hibát kap, és ezt bizonytalanságként vagy a valós százalékos hibája mutatójaként használhatja. Ha be kell tartania a relatív értékeket, akkor abszolút hibát kell használnia, mert a relatív (százalékos) hiba a referenciapontjától függően változik.
Nehéz konkrét meghatározást adni a 0-ra. .. “A nulla az a 0-val jelölt egész szám, amely számlálási számként használva azt jelenti, hogy nincsenek objektumok.” – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html
Nyugodtan válogathat, de a nulla lényegében nem jelent semmit, nincs ott. Ezért nincs értelme a relatív hiba kiszámításakor a nyomásmérőt használni. bár hasznos, feltételezi, hogy nincs semmi légköri nyomáson. Tudjuk, hogy ez nem így van, mert abszolút nyomása 1 atm. Így a semmihez viszonyított relatív hiba csak nem létezik, ez nincs meghatározva .
Nyugodtan vitathat ez ellen, egyszerűen fogalmazva: a gyors javítások, például az egyik hozzáadása az alsó értékhez, hibásak és nem pontosak. Ezek akkor is hasznosak lehetnek, ha egyszerűen a hibák minimalizálására törekszenek. Ha mégis bizonytalanságot próbál pontosan mérni, akkor nem annyira …