Hur beräknar jag relativa fel när det sanna värdet är noll?

Säg att jag har $ x_ {true} = 0 $ och $ x_ {test} $. Om jag definierar relativt fel som:

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $

Då det relativa felet är alltid odefinierat. Om jag istället använder definitionen:

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $

Sedan det relativa felet är alltid 100%. Båda metoderna verkar värdelösa. Finns det ett annat alternativ?

Kommentarer

  • Jag hade exakt samma fråga angående parametervariationer i Monte Carlo-simuleringar med din första definition. Ett av mina parametervärden var 0, så jag ’ t beräknade inte parameterbias för just denna parameter …
  • Lösningen är att inte använda relativa fel i detta fall.

Svar

Det finns många alternativ , beroende på syftet.


En vanlig är ”Relativ procentuell skillnad”, eller RPD, som används vid laboratoriekvalitetsprocedurer. Även om du kan hitta många till synes olika formler, kommer de alla att jämföra skillnaden mellan två värden och deras genomsnittliga storlek:

$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$

Detta är ett signerat uttryck, positivt när $ x $ överstiger $ y $ och negativt när $ y $ överstiger $ x $. Dess värde ligger alltid mellan $ -2 $ och $ 2 $. Genom att använda absoluta värden i nämnaren hanterar det negativa tal på ett rimligt sätt. De flesta referenser jag kan hitta, till exempel New Jersey DEP Site Remediation Program Data Quality Assessment and Data Usability Evaluation Technical Guidance , använder det absoluta värdet $ d_1 $ eftersom de bara är intresserade av storleken på det relativa felet.


A Wikipedia-artikel om Relativ förändring och skillnad observerar att

$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$

används ofta som ett relativt toleransprov i numeriska algoritmer med flytande punkter. Samma artikel påpekar också att formler som $ d_1 $ och $ d_ \ infty $ kan generaliseras till

$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$

där funktionen $ f $ beror direkt på storleken på $ x $ och $ y $ (brukar antas att $ x $ och $ y $ är positiva). Som exempel erbjuder det max-, min- och aritmetiska medelvärden (med och utan att ta de absoluta värdena på $ x $ och $ y $ själva), men man kan överväga andra typer av medelvärden som det geometriska medelvärdet $ \ sqrt {| xy |} $, det harmoniska medelvärdet $ 2 / (1 / | x | + 1 / | y |) $ och $ L ^ p $ betyder $ ((| x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ motsvarar $ p = 1 $ och $ d_ \ infty $ motsvarar gränsen som $ p \ till \ infty $.) Man kan välja en $ f $ baserat på det förväntade statistiska beteendet $ x $ och $ y $. Till exempel, med ungefär lognormala fördelningar skulle det geometriska medelvärdet vara ett attraktivt val för $ f $ eftersom det är ett meningsfullt medelvärde under den omständigheten.


De flesta av dessa formler stöter på svårigheter när nämnaren är lika med noll. I många applikationer är det antingen inte möjligt eller det är ofarligt att sätta skillnaden till noll när $ x = y = 0 $.

Observera att alla dessa definitioner delar en grundläggande invarians egenskap: oavsett vilken relativ skillnadsfunktion $ d $ kan vara, ändras den inte när argumenten omskalas enhetligt med $ \ lambda \ gt 0 $:

$$ d (x, y) = d ( \ lambda x, \ lambda y). $$

Det är den här egenskapen som låter oss betrakta $ d $ som en relativ skillnad. Särskilt en icke-invariant funktion som

$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$

kvalificerar sig helt enkelt inte. Oavsett dygder det kan ha, det uttrycker inte en släkt skillnad .


Historien slutar inte här. Vi kanske till och med tycker att det är fruktbart att driva konsekvenserna av invarians lite längre.

Uppsättningen alla ordnade par av reella tal $ (x, y) \ ne (0,0) $ där $ (x, y) $ anses vara samma som $ (\ lambda x, \ lambda y) $ är Real Projective Line $ \ mathbb {RP} ^ 1 $. I både topologisk och algebraisk mening är $ \ mathbb {RP} ^ 1 $ en cirkel. Alla $ (x, y) \ ne (0,0) $ bestämmer en unik linje genom ursprunget $ (0,0) $. När $ x \ ne 0 $ är lutningen $ y / x $; annars kan vi betrakta dess lutning som ”oändlig” (och antingen negativ eller positiv). Ett område med denna vertikala linje består av linjer med extremt stora positiva eller extremt stora negativa sluttningar. Vi kan parametrisera alla sådana rader i termer av deras vinkel $ \ theta = \ arctan (y / x) $, med $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $.Associerad med varje sådan $ \ theta $ är en punkt i cirkeln,

$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ left (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ right). $$

Alla avstånd som definieras på cirkeln kan därför användas för att definiera en relativ skillnad.

Som ett exempel på vart detta kan leda, överväg det vanliga (euklidiska) avståndet på cirkeln, varvid avståndet mellan två punkter är storleken på vinkeln mellan dem. Den relativa skillnaden är minst när $ x = y $, motsvarande $ 2 \ theta = \ pi / 2 $ (eller $ 2 \ theta = -3 \ pi / 2 $ när $ x $ och $ y $ har motsatta tecken). Ur denna synvinkel skulle en naturlig relativ skillnad för positiva tal $ x $ och $ y $ vara avståndet till denna vinkel:

$$ d_S (x, y) = \ left | 2 \ arctan \ vänster (\ frac {y} {x} \ höger) – \ pi / 2 \ höger |. $$

För första ordningen är detta det relativa avståndet $ | xy | / | y | $ – -men det fungerar även när $ y = 0 $. Dessutom spränger det inte, men istället (som ett signerat avstånd) är det begränsat mellan $ – \ pi / 2 $ och $ \ pi / 2 $, eftersom den här grafen indikerar:

Figur

Detta antyder hur flexibla valen är när man väljer ett sätt att mäta relativa skillnader.

Kommentarer

  • Tack för det omfattande svaret, vad tycker du är den bästa referensen för den här raden: ” används ofta som ett relativt tolerantest i numeriska algoritmer med flytande punkter. Samma artikel påpekar också att formler som d1d1 och d∞d∞ kan generaliseras till ”
  • @Hammad Följer du länken till Wikipedia-artikeln?
  • Ja! Jag tittade på Wikipedia; jag tror att ’ s inte en egentlig referens (även den raden är utan referens på wiki)
  • btw, nevermind Jag hittade en akademisk referens för detta 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
  • @KutalmisB Tack för att du märker att: ” min ” hör inte alls ’ till. Det ser ut som att det kan ha varit en rest av en mer komplex formel som hanterade alla möjliga tecken på $ x $ och $ y $ som jag senare förenklade. Jag har tagit bort den.

Svar

Observera först att du vanligtvis tar det absoluta värdet vid beräkning av den relativa fel.

En vanlig lösning på problemet är att beräkna

$$ \ text {relative error} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$

Kommentarer

  • Detta är problematiskt eftersom det varierar beroende på de måttenheter som valts för värdena.
  • Att ’ s helt sant. Det här är inte ’ en perfekt lösning på problemet, men det är ett vanligt tillvägagångssätt som fungerar ganska bra när $ x $ är väl skalat.
  • Kan du utveckla i ditt svar på vad du menar med ” väl skalad ”? Antag till exempel att data härrör från kalibrering av ett vattenhaltigt kemiskt mätsystem som är utformat för koncentrationer mellan $ 0 $ och $ 0,000001 $ mol / liter som kan uppnå en precision på, säg, tre signifikanta siffror. Ditt ” relativa fel ” skulle därför vara konstant noll förutom uppenbart felaktiga mätningar. Mot bakgrund av detta, hur skulle du exakt skalera om sådan data?
  • Ditt exempel är ett variabeln inte är ’ inte väl skalad. Med ” väl skalad ” menar jag att variabeln skalas så att den får värden i ett litet intervall (t.ex. ett par av storleksordningar) nära 1. Om din variabel tar på sig värden över många storleksordningar än du ’ har vi fått allvarligare skalningsfrågor och det här enkla tillvägagångssättet är inte ”>

kommer inte att vara adekvat.

  • Har du någon referens för detta tillvägagångssätt? Namnet på denna metod? Tack.
  • Svar

    MAPE Formula

    Hitta MAPE,

    Det är mycket diskutabelt ämne och många open source-bidragsgivare har diskuterat om ovanstående ämne. Det mest effektiva tillvägagångssättet hittills följs av utvecklarna. Se denna PR för mer information.

    Svar

    Jag var lite förvirrad över detta ett tag. I slutändan är det för att om du försöker mäta relativa fel med avseende på noll så försöker du tvinga något som helt enkelt inte existerar.

    Om du tänker på det, jämför du äpplen med apelsiner när du jämför det relativa felet med felet uppmätt från noll, eftersom felet uppmätt från noll motsvarar det uppmätta värdet (det är därför du få 100% fel när du dividerar med testnumret).

    Tänk till exempel på att mäta fel på mättrycket (det relativa trycket från atmosfären) jämfört med det absoluta trycket. Säg att du använder ett instrument för att mäta mättrycket vid perfekta atmosfäriska förhållanden, och att din enhet mätt atmosfärstryck på så att den skulle registrera 0% fel. Med hjälp av ekvationen du angav, och först förutsatt att vi använde det uppmätta mättrycket, för att beräkna relativt fel: $$ \ text {relative error} = \ frac {P_ {gauge, true} – P_ {gauge, test}} {P_ {gauge, true}} $$ Sedan $ P_ {gauge, true} = 0 $ och $ P_ {gauge, test} = 0 $ och du får inte 0% fel, istället är det odefinierat. Det beror på att det faktiska procentuella felet ska använda de absoluta tryckvärdena så här: $$ \ text {relative error} = \ frac {P_ {absolute, true} -P_ {absolute, test}} {P_ {absolut, sant}} $$ Nu $ P_ {absolut, true} = 1 atm $ och $ P_ {absolut, test} = 1 atm $ och du får 0% fel. Detta är rätt tillämpning av relativa fel. Den ursprungliga applikationen som använde mättrycket var mer som ”relativt fel i det relativa värdet” vilket är en annan sak än ”relativt fel”. Du måste konvertera mättrycket till absolut innan du mäter det relativa felet.

    Lösningen på din fråga är att se till att du har att göra med absoluta värden när du mäter relativa fel, så att noll inte är en möjlighet. Då får du faktiskt relativa fel och kan använda det som en osäkerhet eller ett mått på ditt verkliga procentuella fel. Om du måste hålla fast vid relativa värden, bör du använda absolut fel, eftersom det relativa (procent) felet ändras beroende på din referenspunkt.

    Det är svårt att sätta en konkret definition på 0. .. ”Noll är det heltal som betecknas 0 som, när det används som ett räkningsnummer, betyder att inga objekt finns.” – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html

    Titta gärna, men noll betyder i princip ingenting, det är inte där. Det är därför det inte är vettigt att använda mättryck vid beräkning av relativt fel. , även om det är användbart, antar att det inte finns något vid atmosfärstryck. Vi vet att detta inte är fallet, eftersom det har ett absolut tryck på 1 atm. Således, det relativa felet med avseende på ingenting, existerar bara inte, det är odefinierat .

    Gör gärna argument mot detta, helt enkelt: alla snabbkorrigeringar, som att lägga till en till bottenvärdet, är felaktiga och inte korrekta. De kan fortfarande vara användbara om du bara försöker minimera felet. Om du försöker göra noggranna mätningar av osäkerhet, inte så mycket …

    Lämna ett svar

    Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *