Hvordan beregner jeg relativ fejl, når den sande værdi er nul?
Sig, at jeg har $ x_ {true} = 0 $ og $ x_ {test} $. Hvis jeg definerer relativ fejl som:
$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $
Så den relative fejl er altid udefineret. Hvis jeg i stedet bruger definitionen:
$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $
Så den relative fejl er altid 100%. Begge metoder virker ubrugelige. Er der et andet alternativ?
Kommentarer
- Jeg havde nøjagtigt det samme spørgsmål angående parametervirkning i Monte Carlo-simuleringer ved hjælp af din første definition. En af mine parameterværdier var 0, så jeg ‘ t beregnede parameter bias for denne særlige parameter …
- Løsningen er at ikke bruge relativ fejl i denne sag.
Svar
Der er mange alternativer , afhængigt af formålet.
En almindelig er “Relativ procentforskel” eller RPD, der anvendes i laboratoriekvalitets kontrolprocedurer. Selvom du kan finde mange tilsyneladende forskellige formler, kommer de alle sammen til at sammenligne forskellen mellem to værdier med deres gennemsnitlige størrelse:
$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$
Dette er et underskrevet udtryk, positivt når $ x $ overstiger $ y $ og negativt når $ y $ overstiger $ x $. Dens værdi ligger altid mellem $ -2 $ og $ 2 $. Ved at bruge absolutte værdier i nævneren håndterer det negative tal på en rimelig måde. De fleste referencer, jeg kan finde, såsom DEP New York DEP Site Remediation Program Data Quality Assessment and Data Usability Evaluation Technical Guidance , bruger den absolutte værdi på $ d_1 $ fordi de kun er interesseret i størrelsen af den relative fejl.
A Wikipedia-artikel om Relativ ændring og forskel bemærker, at
$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$
bruges ofte som en relativ tolerancetest i numeriske algoritmer med flydende punkt. Den samme artikel påpeger også, at formler som $ d_1 $ og $ d_ \ infty $ kan generaliseres til
$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$
hvor funktionen $ f $ afhænger direkte af størrelsen på $ x $ og $ y $ (normalt forudsat at $ x $ og $ y $ er positive). Som eksempler giver det deres maks, min og aritmetiske gennemsnit (med og uden at tage de absolutte værdier på $ x $ og $ y $ selv), men man kan overveje andre slags gennemsnit som det geometriske gennemsnit $ \ sqrt {| xy |} $, det harmoniske gennemsnit $ 2 / (1 / | x | + 1 / | y |) $ og $ L ^ p $ betyder $ ((| x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ svarer til $ p = 1 $ og $ d_ \ infty $ svarer til grænsen som $ p \ til \ infty $.) Man kan vælge en $ f $ baseret på den forventede statistiske adfærd på $ x $ og $ y $. For eksempel, med omtrent lognormale fordelinger ville det geometriske gennemsnit være et attraktivt valg for $ f $, fordi det er et meningsfuldt gennemsnit under den omstændighed.
De fleste af disse formler løber i vanskeligheder, når nævneren er lig med nul. I mange applikationer er det enten ikke muligt, eller det er harmløst at indstille forskellen til nul, når $ x = y = 0 $.
Bemærk, at alle disse definitioner deler en grundlæggende invarians egenskab: uanset hvilken relativ forskel funktion $ d $ måtte være, ændres den ikke, når argumenterne omskales ensartet med $ \ lambda \ gt 0 $:
$$ d (x, y) = d ( \ lambda x, \ lambda y). $$
Det er denne egenskab, der giver os mulighed for at betragte $ d $ som en relativ forskel. Især en ikke-invariant funktion som
$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$
kvalificerer sig simpelthen ikke. Uanset hvilke dyder det måtte have, det udtrykker ikke en relativ forskel .
Historien slutter ikke her. Vi kan endda finde det frugtbart at skubbe konsekvenserne af invarians lidt længere.
Sættet med alle ordnede par af reelle tal $ (x, y) \ ne (0,0) $ hvor $ (x, y) $ anses for at være det samme som $ (\ lambda x, \ lambda y) $ er Real Projective Line $ \ mathbb {RP} ^ 1 $. I både topologisk og algebraisk forstand er $ \ mathbb {RP} ^ 1 $ en cirkel. Enhver $ (x, y) \ ne (0,0) $ bestemmer en unik linje gennem oprindelsen $ (0,0) $. Når $ x \ ne 0 $ er hældningen $ y / x $; ellers kan vi betragte dens hældning som “uendelig” (og enten negativ eller positiv). Et kvarter af denne lodrette linje består af linjer med ekstremt store positive eller ekstremt store negative skråninger. Vi kan parametre alle sådanne linjer med hensyn til deres vinkel $ \ theta = \ arctan (y / x) $ med $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $.Associeret med hver sådan $ \ theta $ er et punkt på cirklen,
$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ left (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ right). $$
Enhver afstand defineret på cirklen kan derfor bruges til at definere en relativ forskel.
Som et eksempel på, hvor dette kan føre, skal du overveje den sædvanlige (euklidiske) afstand på cirklen, hvor afstanden mellem to punkter er størrelsen på vinklen mellem dem. Den relative forskel er mindst, når $ x = y $ svarer til $ 2 \ theta = \ pi / 2 $ (eller $ 2 \ theta = -3 \ pi / 2 $, når $ x $ og $ y $ har modsatte tegn). Fra dette synspunkt ville en naturlig relativ forskel for positive tal $ x $ og $ y $ være afstanden til denne vinkel:
$$ d_S (x, y) = \ left | 2 \ arctan \ venstre (\ frac {y} {x} \ højre) – \ pi / 2 \ højre |. $$
Til første ordre er dette den relative afstand $ | xy | / | y | $ – -men det virker, selv når $ y = 0 $. Desuden sprænger den ikke, men i stedet (som en underskrevet afstand) er den begrænset mellem $ – \ pi / 2 $ og $ \ pi / 2 $, som denne graf angiver:
Dette antyder, hvor fleksible valgene er, når du vælger en måde at måle relative forskelle på.
Kommentarer
- Tak for det omfattende svar. Hvad synes du er den bedste reference til denne linje: ” bruges ofte som en relativ tolerantest i numeriske algoritmer med flydende punkt. Den samme artikel påpeger også, at formler som d1d1 og d∞d∞ kan generaliseres til ”
- @Hammad Har du fulgt linket til Wikipedia-artiklen?
- Ja! Jeg kiggede på Wikipedia; jeg tror, at ‘ s ikke en egentlig reference (også den linje er uden nogen henvisning på wiki)
- btw, nevermind Jeg fandt en akademisk reference til dette 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
- @KutalmisB Tak fordi du bemærkede, at: ” min ” hører ikke ‘ til der overhovedet. Det ser ud til, at det kan have været en rest af en mere kompleks formel, der håndterede alle mulige tegn på $ x $ og $ y $, som jeg senere forenklede. Jeg har fjernet det.
Svar
Bemærk først, at du typisk tager den absolutte værdi ved beregning af den relative fejl.
En almindelig løsning på problemet er at beregne
$$ \ text {relative error} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$
Kommentarer
- Dette er problematisk, da det varierer afhængigt af de måleenheder, der er valgt for værdierne.
- At ‘ er helt sandt. Dette er ikke ‘ en perfekt løsning på problemet, men det er en almindelig tilgang, der fungerer rimeligt godt, når $ x $ er godt skaleret.
- Kan du uddybe i dit svar på, hvad du mener med ” godt skaleret “? Antag for eksempel, at dataene stammer fra kalibrering af et vandigt kemisk målesystem designet til koncentrationer mellem $ 0 $ og $ 0,000001 $ mol / liter, som kan opnå en præcision på f.eks. Tre signifikante cifre. Din ” relative fejl ” vil derfor være konstant nul bortset fra åbenlyst fejlagtige målinger. På baggrund af dette, hvordan skal du nøjagtigt genskalere sådanne data?
- Dit eksempel er et, hvor variablen ikke er ‘ ikke godt skaleret. Ved ” godt skaleret ” mener jeg, at variablen skaleres, så den påtager sig værdier i et lille interval (f.eks. Et par af størrelsesordener) nær 1. Hvis din variabel får værdier over mange størrelsesordener end dig ‘ har vi fået mere alvorlige skaleringsproblemer, og denne enkle tilgang er ikke ‘ bliver ikke tilstrækkelig.
- Er der nogen henvisning til denne tilgang? Navnet på denne metode? Tak.
Svar
Find MAPE,
Det er meget diskutabelt emne, og mange open source-bidragydere har diskuteret om ovenstående emne. Den mest effektive tilgang indtil nu følges af udviklerne. Se denne PR for at vide mere.
Svar
Jeg var lidt forvirret over dette i et stykke tid. I sidste ende er det fordi hvis du forsøger at måle relativ fejl i forhold til nul, så prøver du at tvinge noget, der simpelthen ikke eksisterer.
Hvis du tænker over det, sammenligner du æbler med appelsiner, når du sammenligner relativ fejl med fejlen målt fra nul, fordi fejlen målt fra nul svarer til den målte værdi (det er derfor, du få 100% fejl, når du dividerer med testnummeret).
Overvej f.eks. at måle fejl for målertryk (det relative tryk fra atmosfærisk) versus absolut tryk. Sig, at du bruger et instrument til at måle målertrykket under perfekte atmosfæriske forhold, og din enhed målte atmosfærisk trykpunkt på, så det skulle registrere 0% fejl. Brug den ligning, du angav, og forudsat først at vi brugte det målte målertryk til at beregne relativ fejl: $$ \ text {relative error} = \ frac {P_ {gauge, true} – P_ {gauge, test}} {P_ {gauge, true}} $$ Derefter $ P_ {gauge, true} = 0 $ og $ P_ {gauge, test} = 0 $ og du får ikke 0% fejl, i stedet er den udefineret. Det skyldes, at den faktiske procentfejl skal bruge de absolutte trykværdier som denne: $$ \ text {relative error} = \ frac {P_ {absolut, sand} -P_ {absolut, test}} {P_ {absolut, sandt}} $$ Nu $ P_ {absolut, true} = 1 atm $ og $ P_ {absolut, test} = 1 atm $ og du får 0% fejl. Dette er den korrekte anvendelse af relativ fejl. Den oprindelige applikation, der brugte målertryk, lignede mere “relativ fejl af den relative værdi”, hvilket er en anden ting end “relativ fejl”. Du skal konvertere målertrykket til absolut, før du måler den relative fejl.
Løsningen på dit spørgsmål er at sikre, at du har at gøre med absolutte værdier, når du måler relativ fejl, så nul ikke er en mulighed. Så får du faktisk relativ fejl og kan bruge det som en usikkerhed eller en måling af din reelle procentfejl. Hvis du skal holde fast med relative værdier, skal du bruge absolut fejl, fordi den relative (procent) fejl ændres afhængigt af dit referencepunkt.
Det er svært at sætte en konkret definition på 0. .. “Nul er det heltal betegnet 0, der, når det bruges som et taltal, betyder, at der ikke er nogen objekter til stede.” – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html
Du er velkommen til at nit pick, men nul betyder i det væsentlige ingenting, det er ikke der. Derfor er det ikke fornuftigt at bruge måletryk ved beregning af relativ fejl. , selvom det er nyttigt, antager, at der ikke er noget ved atmosfærisk tryk. Vi ved, at dette ikke er tilfældet, fordi det har et absolut tryk på 1 atm. Således eksisterer den relative fejl i forhold til ingenting bare ikke, det er udefineret .
Du er velkommen til at argumentere imod dette, kort sagt: eventuelle hurtige rettelser, såsom at tilføje en til bundværdien, er defekte og ikke nøjagtige. De kan stadig være nyttige, hvis du blot prøver at minimere fejl. Hvis du forsøger at foretage nøjagtige målinger af usikkerhed, ikke så meget …