Jak vypočítám relativní chybu, když je skutečná hodnota nula?
Řekněme, že mám $ x_ {true} = 0 $ a $ x_ {test} $. Pokud definuji relativní chybu jako:
$ \ text {relativní chyba} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $
Potom relativní chyba je vždy nedefinovaná. Pokud místo toho použiji definici:
$ \ text {relativní chyba} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $
Potom relativní chyba je vždy 100%. Obě metody se zdají k ničemu. Existuje jiná alternativa?
Komentáře
- Měl jsem přesně stejnou otázku ohledně zkreslení parametrů v simulacích Monte Carlo, pomocí vaší první definice. Jedna z mých hodnot parametrů byla 0, takže jsem ‚ t nepočítal zkreslení parametrů pro tento konkrétní parametr …
- Řešením je nepoužívat relativní chybu v tento případ.
Odpověď
Existuje mnoho alternativ , v závislosti na účelu.
Běžným je „relativní procentní rozdíl“ neboli RPD používaný v laboratorních postupech kontroly kvality. Ačkoli můžete najít mnoho zdánlivě odlišných vzorců, všechny spočívají v porovnání rozdílu dvou hodnot s jejich průměrnou velikostí:
$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$
Toto je podepsaný výraz, pozitivní, když $ x $ překročí $ y $ a negativní, když $ y $ překročí $ x $. Jeho hodnota se vždy pohybuje mezi $ -2 $ a $ 2 $. Použitím absolutních hodnot ve jmenovateli rozumně zachází se zápornými čísly. Většina referencí, které najdu, například New Jersey DEP Site Remediation Program Assessment Quality Data and Data Usability Evaluation Technical Guidance , use the absolute value of $ d_1 $, protože je zajímá pouze velikost relativní chyby.
Článek Článek na Wikipedii o Relativní změně a rozdílu podotýká, že
$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$
se často používá jako test relativní tolerance v numerických algoritmech s plovoucí desetinnou čárkou. Stejný článek také poukazuje na to, že vzorce jako $ d_1 $ a $ d_ \ infty $ lze zobecnit na
$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$
kde funkce $ f $ přímo závisí na velikostech $ x $ a $ y $ (obvykle za předpokladu, že $ x $ a $ y $ jsou kladné). Jako příklady nabízí jejich maximální, minimální a aritmetický průměr (se samotným i bez absolutních hodnot $ x $ a $ y $ $), ale lze uvažovat o dalších druzích průměrů, jako je geometrický průměr $ \ sqrt {| xy |} $, harmonický průměr $ 2 / (1 / | x | + 1 / | y |) $ a $ L ^ p $ znamená $ ((| | x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ odpovídá $ p = 1 $ a $ d_ \ infty $ odpovídá limitu jako $ p \ to \ infty $.) Jeden by si mohl vybrat $ f $ na základě očekávaného statistického chování $ x $ a $ y $. Například s přibližně lognormálním rozdělením by byl geometrický průměr atraktivní volbou pro $ f $, protože za těchto okolností je to smysluplný průměr.
Většina těchto vzorců narazí na potíže, když se jmenovatel rovná nula. V mnoha aplikacích to buď není možné, nebo je neškodné nastavit rozdíl na nulu, když $ x = y = 0 $.
Všimněte si, že všechny tyto definice sdílejí základní invariantnost vlastnost: ať už je funkce relativního rozdílu $ d $ jakákoli, nemění se, když jsou argumenty rovnoměrně změněny pomocí $ \ lambda \ gt 0 $:
$$ d (x, y) = d ( \ lambda x, \ lambda y). $$
Právě tato vlastnost nám umožňuje považovat $ d $ za relativní rozdíl. Tedy zejména neinvariantní funkce jako
$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$
jednoduše nesplňuje podmínky. Ať už mají jakékoli ctnosti, nevyjadřuje relativní rozdíl .
Příběh tím nekončí. Mohlo by se nám dokonce zdát plodné posunout důsledky invariance o něco dále.
Sada všechny seřazené páry reálných čísel $ (x, y) \ ne (0,0) $, kde $ (x, y) $ je považováno za stejné jako $ (\ lambda x, \ lambda y) $ je Skutečná projektová linie $ \ mathbb {RP} ^ 1 $. V topologickém i algebraickém smyslu je $ \ mathbb {RP} ^ 1 $ kruh. Libovolný $ (x, y) \ ne (0,0) $ určuje jedinečnou linii přes počátek $ (0,0) $. Když $ x \ ne 0 $, jeho sklon je $ y / x $; jinak můžeme jeho sklon považovat za „nekonečný“ (a buď negativní nebo pozitivní). Sousedství této svislé čáry se skládá z čar s extrémně velkými kladnými nebo extrémně velkými zápornými svahy. Můžeme všechny takové řádky parametrizovat z hlediska úhlu $ \ theta = \ arctan (y / x) $, s $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $.S každým takovým $ \ theta $ je spojen bod v kruhu,
$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ left (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ right). $$
K definování relativního rozdílu lze tedy použít libovolnou vzdálenost definovanou v kruhu.
Jako příklad toho, kam to může vést, zvažte obvyklou (euklidovskou) vzdálenost v kružnici, přičemž vzdálenost mezi dvěma body je velikost úhlu mezi nimi. Relativní rozdíl je nejméně, když $ x = y $, což odpovídá $ 2 \ theta = \ pi / 2 $ (nebo $ 2 \ theta = -3 \ pi / 2 $, když $ x $ a $ y $ mají opačné znaky). Z tohoto pohledu by přirozený relativní rozdíl pro kladná čísla $ x $ a $ y $ byl vzdálenost k tomuto úhlu:
$$ d_S (x, y) = \ left | 2 \ arctan \ left (\ frac {y} {x} \ right) – \ pi / 2 \ right |. $$
K první objednávce je to relativní vzdálenost $ | xy | / | y | $ – -ale funguje to, i když $ y = 0 $. Navíc to nevybuchne, ale místo toho (jako podepsaná vzdálenost) je omezeno mezi $ – \ pi / 2 $ a $ \ pi / 2 $, jak ukazuje tento graf:
To naznačuje, jak flexibilní jsou možnosti při výběru způsobu měření relativních rozdílů.
Komentáře
- Děkujeme za komplexní odpověď, co je podle vás nejlepší referencí pro tento řádek: “ se často používá jako test relativní tolerance v numerických algoritmech s plovoucí desetinnou čárkou. Stejný článek také zdůrazňuje, že vzorce jako d1d1 a d∞d∞ lze zobecnit na “
- @Hammad Sledovali jste odkaz na článek na Wikipedii?
- Ano, podíval jsem se na Wikipedii; myslím, že ‚ s není skutečný odkaz (také ten řádek je bez jakéhokoli odkazu na wiki)
- btw, nevermind Na toto jsem našel akademický odkaz 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
- @KutalmisB Děkujeme, že jste si toho všimli: “ min. “ tam vůbec ‚ nepatří. Vypadá to, že to mohla být pozůstatek složitějšího vzorce, který zvládl všechny možné známky $ x $ a $ y $, které jsem později zjednodušil. Odstranil jsem to.
Odpověď
Nejprve si povšimněte, že při výpočtu relativní hodnoty obvykle berete absolutní hodnotu chyba.
Běžným řešením problému je výpočet
$$ \ text {relativní chyba} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$
Komentáře
- To je problematické v tom, že se liší v závislosti na měrných jednotkách zvolených pro hodnoty.
- To ‚ s absolutně pravdivý. Toto není ‚ dokonalé řešení problému, ale je to běžný přístup, který funguje přiměřeně dobře, když je $ x $ dobře upraveno.
- Mohl byste to podrobně popsat vaše odpověď na to, co máte na mysli pod pojmem “ dobře odstupňovaným „? Předpokládejme například, že data pocházejí z kalibrace vodného chemického měřicího systému určeného pro koncentrace mezi 0 $ a 0,000001 $ mol / litr, které mohou dosáhnout přesnosti, řekněme, tří platných číslic. Vaše “ relativní chyba “ by proto byla s výjimkou zjevně chybných měření neustále nulová. S ohledem na to, jak přesně byste změnili měřítko takových dat?
- Váš příklad je takový, kde proměnná není dobře upravena. ‚ t. Tím, že “ dobře škálovatelné “ mám na mysli, že tato proměnná je zmenšena tak, aby nabývala hodnot v malém rozsahu (např. Pár řádů) blízko 1. Pokud vaše proměnná nabývá hodnot na mnoha řádech, než jste ‚ dostali vážnější problémy se škálováním a tento jednoduchý přístup není ‚ nebude to adekvátní.
- Nějaký odkaz na tento přístup? Název této metody? Děkuji.
Odpověď
Hledání MAPE,
Je to velmi diskutabilní téma a mnoho přispěvatelů opensource diskutovalo o výše uvedeném tématu. Nejefektivnější přístup doposud sledují vývojáři. Další informace najdete v tomto PR .
Odpovědět
Byl jsem z toho na chvíli trochu zmatený. Nakonec je to proto, že pokud se pokoušíte měřit relativní chybu s ohledem na nulu, pak se snažíte vynutit něco, co jednoduše neexistuje.
Pokud o tom přemýšlíte, porovnáváte jablka s pomeranči, když porovnáváte relativní chybu s chybou měřenou od nuly, protože chyba měřená od nuly je ekvivalentní měřené hodnotě (proto získejte 100% chybu, když vydělíte číslem testu).
Zvažte například chybu měření přetlaku (relativního tlaku od atmosférického) vs. absolutního tlaku. Řekněme, že používáte přístroj k měření tlaku měřidla za dokonalých atmosférických podmínek a že vaše zařízení měřilo bod atmosférického tlaku tak, aby zaznamenával chybu 0%. Pomocí rovnice, kterou jste zadali, a nejprve za předpokladu, že jsme použili změřený měřicí tlak, k výpočtu relativní chyby: $$ \ text {relativní chyba} = \ frac {P_ {měřidlo, true} – P_ {gauge, test}} {P_ {gauge, true}} $$ Potom $ P_ {gauge, true} = 0 $ a $ P_ {gauge, test} = 0 $ a nedostanete 0% chybu, místo toho je nedefinováno. Je to proto, že skutečná procentuální chyba by měla používat hodnoty absolutního tlaku, jako je tato: $$ \ text {relativní chyba} = \ frac {P_ {absolutní, skutečný} -P_ {absolutní, test}} {P_ {absolute, true}} $$ Nyní $ P_ {absolute, true} = 1 atm $ a $ P_ {absolute, test} = 1 atm $ a dostanete 0% chybu. Toto je správné použití relativní chyby. Původní aplikace, která používala přetlak, byla spíše jako „relativní chyba relativní hodnoty“, což je jiná věc než „relativní chyba“. Před měřením relativní chyby musíte převést manometrický tlak na absolutní.
Řešením vaší otázky je ujistit se, že při měření relativní chyby máte na mysli absolutní hodnoty, takže nula není možná. Pak ve skutečnosti dostáváte relativní chybu a můžete ji použít jako nejistotu nebo metriku své skutečné procentuální chyby. Pokud se musíte držet relativních hodnot, měli byste používat absolutní chybu, protože relativní (procentní) chyba se bude měnit v závislosti na vašem referenčním bodě.
Je těžké dát konkrétní definici na 0. .. „Nula je celé číslo označené 0, které při použití jako počítací číslo znamená, že nejsou přítomny žádné objekty.“ – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html
Nebojte se vybrat nit, ale nula v podstatě nic neznamená, není tam. Proto nemá smysl při výpočtu relativní chyby používat přetlak. , i když je to užitečné, předpokládá, že při atmosférickém tlaku nic není. Víme však, že tomu tak není, protože má absolutní tlak 1 atm. Relativní chyba vzhledem k ničemu tedy prostě neexistuje, je nedefinovaná .
Nebojte se proti tomu jednoduše odpovědět: jakékoli rychlé opravy, například přidání jedné ke spodní hodnotě, jsou vadné a nepřesné. Mohou být stále užitečné, pokud se jednoduše snažíte minimalizovat chyby. Pokud se však snažíte provést přesná měření nejistoty, ne tolik …