Come faccio a calcolare lerrore relativo quando il valore vero è zero?
Supponiamo di avere $ x_ {true} = 0 $ e $ x_ {test} $. Se definisco errore relativo come:
$ \ text {errore relativo} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $
Allora lerrore relativo è sempre indefinito. Se invece utilizzo la definizione:
$ \ text {errore relativo} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $
Allora lerrore relativo è sempre del 100%. Entrambi i metodi sembrano inutili. Cè unaltra alternativa?
Commenti
- Ho avuto la stessa identica domanda riguardo al bias dei parametri nelle simulazioni Monte Carlo, usando la tua prima definizione. Uno dei miei valori di parametro era 0, quindi non ho ‘ calcolare la distorsione del parametro per questo particolare parametro …
- La soluzione è non utilizzare lerrore relativo in questo caso.
Risposta
Ci sono molte alternative , a seconda dello scopo.
Una comune è la “differenza percentuale relativa” o RPD, utilizzata nelle procedure di controllo della qualità di laboratorio. Sebbene tu possa trovare molte formule apparentemente diverse, tutte si riducono a confrontare la differenza di due valori con la loro grandezza media:
$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$
Questa è unespressione con segno , positiva quando $ x $ supera $ y $ e negativa quando $ y $ supera $ x $. Il suo valore è sempre compreso tra $ -2 $ e $ 2 $. Utilizzando valori assoluti nel denominatore gestisce i numeri negativi in modo ragionevole. La maggior parte dei riferimenti che riesco a trovare, come il Programma di riparazione del sito DEP del New Jersey, Valutazione della qualità dei dati e Guida tecnica per la valutazione dellusabilità dei dati , utilizza il valore assoluto di $ d_1 $ perché sono interessati solo allentità dellerrore relativo.
Un articolo di Wikipedia su Cambiamento relativo e differenza osserva che
$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$
viene spesso utilizzato come test di tolleranza relativa negli algoritmi numerici in virgola mobile. Lo stesso articolo sottolinea anche che formule come $ d_1 $ e $ d_ \ infty $ possono essere generalizzate a
$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$
dove la funzione $ f $ dipende direttamente dalle grandezze di $ x $ e $ y $ (di solito assumendo che $ x $ e $ y $ siano positivi). A titolo di esempio, offre la loro media aritmetica massima, minima e (con e senza prendere i valori assoluti di $ x $ e $ y $ stessi), ma si potrebbero contemplare altri tipi di medie come la media geometrica $ \ sqrt {| xy |} $, la media armonica $ 2 / (1 / | x | + 1 / | y |) $ e $ L ^ p $ significa $ ((| x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ corrisponde a $ p = 1 $ e $ d_ \ infty $ corrisponde al limite da $ p \ a \ infty $.) Si potrebbe scegliere un $ f $ in base al comportamento statistico previsto di $ x $ e $ y $. Ad esempio, con distribuzioni approssimativamente lognormali la media geometrica sarebbe una scelta interessante per $ f $ perché è una media significativa in quella circostanza.
La maggior parte di queste formule incontra difficoltà quando il denominatore è uguale zero. In molte applicazioni che non è possibile o è innocuo impostare la differenza a zero quando $ x = y = 0 $.
Nota che tutte queste definizioni condividono uninvarianza fondamentale proprietà: qualunque sia la funzione differenza relativa $ d $, non cambia quando gli argomenti vengono ridimensionati in modo uniforme da $ \ lambda \ gt 0 $:
$$ d (x, y) = d ( \ lambda x, \ lambda y). $$
È questa proprietà che ci permette di considerare $ d $ come una differenza relativa . Quindi, in particolare, una funzione non invariante come
$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$
semplicemente non si qualifica. Qualunque sia la virtù che potrebbe avere, non esprime una differenza relativa.
La storia non finisce qui. Potremmo persino trovare utile spingere un po oltre le implicazioni dellinvarianza.
Linsieme di tutte le coppie ordinate di numeri reali $ (x, y) \ ne (0,0) $ dove $ (x, y) $ è considerato uguale a $ (\ lambda x, \ lambda y) $ è il Linea proiettiva reale $ \ mathbb {RP} ^ 1 $. Sia in senso topologico che in senso algebrico, $ \ mathbb {RP} ^ 1 $ è un cerchio. Qualsiasi $ (x, y) \ ne (0,0) $ determina una linea univoca attraverso lorigine $ (0,0) $. Quando $ x \ ne 0 $ la sua pendenza è $ y / x $; altrimenti possiamo considerare la sua pendenza come “infinita” (e negativa o positiva). Un quartiere di questa linea verticale è costituito da linee con pendenze positive o negative estremamente grandi. Possiamo parametrizzare tutte queste linee in termini del loro angolo $ \ theta = \ arctan (y / x) $, con $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $.Associato a ciascuno di questi $ \ theta $ è un punto sul cerchio,
$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ left (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ right). $$
Qualsiasi distanza definita sul cerchio può quindi essere utilizzata per definire una differenza relativa.
Come esempio di dove questo può portare, si consideri la solita distanza (euclidea) sul cerchio, per cui la distanza tra due punti è la dimensione dellangolo tra di loro. La differenza relativa è minima quando $ x = y $, corrispondente a $ 2 \ theta = \ pi / 2 $ (o $ 2 \ theta = -3 \ pi / 2 $ quando $ x $ e $ y $ hanno segni opposti). Da questo punto di vista una differenza relativa naturale per i numeri positivi $ x $ e $ y $ sarebbe la distanza da questo angolo:
$$ d_S (x, y) = \ left | 2 \ arctan \ sinistra (\ frac {y} {x} \ right) – \ pi / 2 \ right |. $$
In primo luogo, questa è la distanza relativa $ | xy | / | y | $ – -ma funziona anche quando $ y = 0 $. Inoltre, non esplode, ma invece (come distanza con segno) è limitata tra $ – \ pi / 2 $ e $ \ pi / 2 $, come indica questo grafico:
Questo suggerisce quanto siano flessibili le scelte quando si seleziona un modo per misurare le differenze relative.
Commenti
- Grazie per la risposta completa, qual è secondo te il miglior riferimento per questa riga: ” viene spesso utilizzato come test di tolleranza relativa negli algoritmi numerici in virgola mobile. Lo stesso articolo sottolinea anche che formule come d1d1 e d∞d∞ possono essere generalizzate a ”
- @Hammad Hai seguito il link allarticolo di Wikipedia?
- Sì! Ho dato unocchiata a Wikipedia; penso che ‘ s non un riferimento reale (anche quella riga è senza alcun riferimento sul wiki)
- btw, non importa, ho trovato un riferimento accademico per questo 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
- @KutalmisB Grazie per aver notato che: ” min ” non ‘ non vi appartiene affatto. Sembra che potrebbe essere stato un residuo di una formula più complessa che gestiva tutti i possibili segni di $ x $ e $ y $ che ho successivamente semplificato. Lho rimosso.
Risposta
Innanzitutto, tieni presente che in genere prendi il valore assoluto nel calcolare il valore relativo errore.
Una soluzione comune al problema è calcolare
$$ \ text {errore relativo} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$
Commenti
- Ciò è problematico in quanto varia a seconda delle unità di misura scelte per i valori.
- Questo ‘ è assolutamente vero. Questa non è ‘ una soluzione perfetta al problema, ma è un approccio comune che funziona ragionevolmente bene quando $ x $ è ben ridimensionato.
- Potresti elaborare in la tua risposta su cosa intendi per ” ben ridimensionato “? Ad esempio, si supponga che i dati derivino dalla calibrazione di un sistema di misurazione chimica acquosa progettato per concentrazioni comprese tra $ 0 $ e $ 0,000001 $ moli / litro che può raggiungere una precisione di, diciamo, tre cifre significative. Il tuo ” errore relativo ” sarebbe quindi costantemente zero tranne che per misurazioni ovviamente errate. Alla luce di ciò, come ridimensionereste esattamente tali dati?
- Il vostro esempio è quello in cui la variabile non è ‘ t ben ridimensionata. Con ” ben ridimensionato “, intendo che la variabile viene ridimensionata in modo da assumere valori in un intervallo ridotto (ad esempio una coppia di ordini di grandezza) vicino a 1. Se la tua variabile assume valori superiori a molti ordini di grandezza di te ‘ hai problemi di ridimensionamento più seri e questo semplice approccio non è ‘ non sarà adeguato.
- Qualche riferimento per questo approccio? Il nome di questo metodo? Grazie.
Risposta
Trovare MAPE,
È un argomento molto discutibile e molti collaboratori opensource hanno discusso sullargomento precedente. Lapproccio più efficiente fino ad ora è seguito dagli sviluppatori. Fare riferimento a questo PR per saperne di più.
Risposta
Sono stato un po confuso su questo per un po. Alla fine, è perché se stai cercando di misurare lerrore relativo rispetto allo zero, allora stai cercando di forzare qualcosa che semplicemente non esiste.
Se ci pensi, stai confrontando le mele con le arance quando confronti lerrore relativo con lerrore misurato da zero, perché lerrore misurato da zero è equivalente al valore misurato (ecco perché ottieni un errore del 100% quando dividi per il numero del test).
Ad esempio, considera lerrore di misurazione della pressione relativa (la pressione relativa dallatmosfera) rispetto alla pressione assoluta. Supponiamo che tu utilizzi uno strumento per misurare la pressione relativa in condizioni atmosferiche perfette e che il tuo dispositivo abbia misurato il punto della pressione atmosferica in modo che dovrebbe registrare un errore dello 0%. Utilizzando lequazione che hai fornito, e prima supponendo di aver utilizzato la pressione relativa misurata, per calcolare lerrore relativo: $$ \ text {relative error} = \ frac {P_ {gauge, true} – P_ {gauge, test}} {P_ {gauge, true}} $$ Quindi $ P_ {gauge, true} = 0 $ e $ P_ {gauge, test} = 0 $ e non ottieni lo 0% di errore, invece è indefinito. Questo perché lerrore percentuale effettivo dovrebbe utilizzare i valori di pressione assoluta in questo modo: $$ \ text {errore relativo} = \ frac {P_ {assoluto, vero} -P_ {assoluto, test}} {P_ {absolute, true}} $$ Ora $ P_ {absolute, true} = 1atm $ e $ P_ {absolute, test} = 1atm $ e ottieni lo 0% di errore. Questa è la corretta applicazione dellerrore relativo. Lapplicazione originale che utilizzava la pressione relativa era più simile a “errore relativo del valore relativo”, che è una cosa diversa da “errore relativo”. Devi convertire la pressione relativa in assoluta prima di misurare lerrore relativo.
La soluzione alla tua domanda è assicurarsi di avere a che fare con valori assoluti quando si misura lerrore relativo, in modo che lo zero non sia una possibilità. Quindi stai effettivamente ottenendo un errore relativo e puoi usarlo come unincertezza o una metrica del tuo errore percentuale reale. Se devi attenersi a valori relativi, dovresti usare lerrore assoluto, perché lerrore relativo (percentuale) cambierà a seconda del tuo punto di riferimento.
È difficile mettere una definizione concreta su 0. .. “Zero è il numero intero indicato con 0 che, se utilizzato come numero di conteggio, significa che non sono presenti oggetti.” – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html
Sentiti libero di scegliere il pignolo, ma zero essenzialmente non significa nulla, non è presente. Questo è il motivo per cui non ha senso utilizzare la pressione relativa quando si calcola lerrore relativo. Pressione relativa , sebbene utile, presuppone che non ci sia nulla alla pressione atmosferica. Sappiamo che non è così, perché ha una pressione assoluta di 1 atm. Quindi, lerrore relativo rispetto a nulla, semplicemente non esiste, è indefinito .
Sentiti libero di discutere contro questo, in poche parole: qualsiasi soluzione rapida, come laggiunta di uno al valore inferiore, è difettosa e non accurata. Possono essere ancora utili se stai semplicemente cercando di ridurre al minimo lerrore. Se stai cercando di effettuare misurazioni accurate dellincertezza, non così tanto …