Wie berechne ich den relativen Fehler, wenn der wahre Wert Null ist?
Angenommen, ich habe $ x_ {true} = 0 $ und $ x_ {test} $. Wenn ich einen relativen Fehler definiere als:
$ \ text {relativer Fehler} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $
Dann Der relative Fehler ist immer undefiniert. Wenn ich stattdessen die Definition verwende:
$ \ text {relativer Fehler} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $
Dann Der relative Fehler beträgt immer 100%. Beide Methoden scheinen nutzlos. Gibt es eine andere Alternative?
Kommentare
- Ich hatte genau die gleiche Frage bezüglich der Parameterverzerrung in Monte-Carlo-Simulationen unter Verwendung Ihrer ersten Definition. Einer meiner Parameterwerte war 0, daher habe ich ‚ keine Parametervorspannung für diesen bestimmten Parameter berechnet …
- Die Lösung besteht darin, keinen relativen Fehler in zu verwenden In diesem Fall.
Antwort
Es gibt viele Alternativen Je nach Verwendungszweck.
Häufig ist der „Relative Percent Difference“ (RPD), der in Laborqualitätskontrollverfahren verwendet wird. Obwohl Sie viele scheinbar unterschiedliche Formeln finden können, müssen alle die Differenz zweier Werte mit ihrer durchschnittlichen Größe vergleichen:
$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$
Dies ist ein vorzeichenbehafteter Ausdruck, positiv, wenn $ x $ $ y $ überschreitet, und negativ, wenn $ y $ $ x $ überschreitet. Sein Wert liegt immer zwischen $ -2 $ und $ 2 $. Durch die Verwendung von Absolutwerten im Nenner werden negative Zahlen in angemessener Weise behandelt. Die meisten Referenzen, die ich finden kann, wie z. B. die DEP Site Remediation Program in New Jersey $, weil sie nur an der Größe des relativen Fehlers interessiert sind.
Ein Wikipedia-Artikel über Relative Change and Difference stellt fest, dass
$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$
wird häufig als relativer Toleranztest in numerischen Gleitkomma-Algorithmen verwendet. In demselben Artikel wird auch darauf hingewiesen, dass Formeln wie $ d_1 $ und $ d_ \ infty $ auf
$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$
wobei die Funktion $ f $ direkt von den Größen von $ x $ und $ y $ abhängt (normalerweise unter der Annahme, dass $ x $ und $ y $ positiv sind). Als Beispiel bietet es ihren maximalen, minimalen und arithmetischen Mittelwert (mit und ohne die absoluten Werte von $ x $ und $ y $ selbst), aber man könnte auch andere Arten von Durchschnittswerten in Betracht ziehen, wie den geometrischen Mittelwert $ \ sqrt {| xy |} $, das harmonische Mittel $ 2 / (1 / | x | + 1 / | y |) $ und $ L ^ p $ bedeutet $ ((| x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ entspricht $ p = 1 $ und $ d_ \ infty $ entspricht dem Limit als $ p \ bis \ infty $.) Man könnte ein $ f $ basierend auf dem erwarteten statistischen Verhalten von $ x $ und $ wählen y $. Zum Beispiel wäre bei ungefähr logarithmischen Normalverteilungen das geometrische Mittel eine attraktive Wahl für $ f $, da es unter diesen Umständen ein aussagekräftiger Durchschnitt ist.
Die meisten dieser Formeln stoßen auf Schwierigkeiten, wenn der Nenner gleich ist Null. In vielen Anwendungen ist dies entweder nicht möglich oder es ist harmlos, die Differenz auf Null zu setzen, wenn $ x = y = 0 $.
Beachten Sie, dass alle diese Definitionen eine grundlegende Invarianz aufweisen Eigenschaft: Was auch immer die relative Differenzfunktion $ d $ sein mag, sie ändert sich nicht, wenn die Argumente einheitlich durch $ \ lambda \ gt 0 $ neu skaliert werden:
$$ d (x, y) = d ( \ lambda x, \ lambda y). $$
Mit dieser Eigenschaft können wir $ d $ als relativen Unterschied betrachten. Somit ist insbesondere eine nichtinvariante Funktion wie
$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$
qualifiziert sich einfach nicht. Welche Tugenden es auch haben mag, es drückt keinen relativen Unterschied aus.
Die Geschichte endet hier nicht. Es könnte sogar fruchtbar sein, die Auswirkungen der Invarianz ein wenig weiter voranzutreiben.
Die Menge von Alle geordneten Paare reeller Zahlen $ (x, y) \ ne (0,0) $ wobei $ (x, y) $ als dasselbe angesehen wird wie $ (\ lambda x, \ lambda y) $ ist das Real Projective Line $ \ mathbb {RP} ^ 1 $. Sowohl im topologischen als auch im algebraischen Sinne ist $ \ mathbb {RP} ^ 1 $ ein Kreis. Jedes $ (x, y) \ ne (0,0) $ bestimmt eine eindeutige Linie durch den Ursprung $ (0,0) $. Wenn $ x \ ne 0 $ ist, ist seine Steigung $ y / x $; Andernfalls können wir die Steigung als „unendlich“ (und entweder negativ oder positiv) betrachten. Eine Nachbarschaft dieser vertikalen Linie besteht aus Linien mit extrem großen positiven oder extrem großen negativen Steigungen. Wir können alle diese Linien hinsichtlich ihres Winkels $ \ theta = \ arctan (y / x) $ mit $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $ parametrisieren.Mit jedem solchen $ \ theta $ ist ein Punkt auf dem Kreis verbunden,
$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ left (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ right). $$
Jeder auf dem Kreis definierte Abstand kann daher verwendet werden, um eine relative Differenz zu definieren.
Betrachten Sie als Beispiel dafür, wohin dies führen kann, den üblichen (euklidischen) Abstand auf dem Kreis, wobei der Abstand zwischen zwei Punkten die Größe des Winkels zwischen ihnen ist. Der relative Unterschied ist am geringsten, wenn $ x = y $, entsprechend $ 2 \ theta = \ pi / 2 $ (oder $ 2 \ theta = -3 \ pi / 2 $, wenn $ x $ und $ y $ entgegengesetzte Vorzeichen haben). Unter diesem Gesichtspunkt wäre ein natürlicher relativer Unterschied für positive Zahlen $ x $ und $ y $ der Abstand zu diesem Winkel:
$$ d_S (x, y) = \ left | 2 \ arctan \ left (\ frac {y} {x} \ right) – \ pi / 2 \ right |. $$
Bei der ersten Bestellung ist dies der relative Abstand $ | xy | / | y | $ – -aber es funktioniert auch wenn $ y = 0 $. Darüber hinaus wird es nicht gesprengt, sondern (als vorzeichenbehafteter Abstand) zwischen $ – \ pi / 2 $ und $ \ pi / 2 $ begrenzt, wie in diesem Diagramm angegeben:
Dies zeigt, wie flexibel die Auswahlmöglichkeiten bei der Auswahl einer Methode zur Messung relativer Unterschiede sind.
Kommentare
- Vielen Dank für die umfassende Antwort. Was ist Ihrer Meinung nach die beste Referenz für diese Zeile: “ wird häufig als relativer Toleranztest in numerischen Gleitkomma-Algorithmen verwendet. In demselben Artikel wird auch darauf hingewiesen, dass Formeln wie d1d1 und d∞d∞ auf “ verallgemeinert werden können. li>
- @Hammad Sind Sie dem Link zum Wikipedia-Artikel gefolgt?
- Ja! Ich habe mir Wikipedia angesehen. Ich denke, dass ‚ s keine tatsächliche Referenz (auch diese Zeile ist ohne Referenz im Wiki)
- Übrigens, egal, ich habe eine akademische Referenz dafür gefunden 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
- @KutalmisB Vielen Dank, dass Sie Folgendes bemerkt haben: “ min “ gehört ‚ überhaupt nicht dorthin. Es sieht so aus, als wäre es ein Überbleibsel einer komplexeren Formel gewesen, die alle möglichen Anzeichen von $ x $ und $ y $ behandelt hat, die ich später vereinfacht habe. Ich habe es entfernt.
Antwort
Beachten Sie zunächst, dass Sie bei der Berechnung des Relativs normalerweise den absoluten Wert verwenden Error.
Eine häufige Lösung für das Problem ist die Berechnung von
$$ \ text {relativer Fehler} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$
Kommentare
- Dies ist insofern problematisch, als es in Abhängigkeit von den für die Werte gewählten Maßeinheiten variiert.
- Das ‚ ist absolut wahr. Dies ist keine ‚ perfekte Lösung für das Problem, aber es ist ein gängiger Ansatz, der ziemlich gut funktioniert, wenn $ x $ gut skaliert ist.
- Könnten Sie näher darauf eingehen? Ihre Antwort auf das, was Sie mit “ gut skaliert “ meinen? Angenommen, die Daten stammen aus der Kalibrierung eines wässrigen chemischen Messsystems, das für Konzentrationen zwischen 0 und 0,000001 Mol / Liter ausgelegt ist und eine Genauigkeit von beispielsweise drei signifikanten Stellen erreichen kann. Ihr relativer Fehler “ “ wäre daher bis auf offensichtlich fehlerhafte Messungen konstant Null. Wie genau würden Sie vor diesem Hintergrund solche Daten neu skalieren?
- In Ihrem Beispiel ist die Variable ‚ nicht gut skaliert. Mit “ gut skaliert “ meine ich, dass diese Variable so skaliert ist, dass sie Werte in einem kleinen Bereich annimmt (z. B. ein paar) von Größenordnungen) in der Nähe von 1. Wenn Ihre Variable Werte über viele Größenordnungen annimmt, haben Sie ‚ schwerwiegendere Skalierungsprobleme und dieser einfache Ansatz ist nicht ‚ wird nicht angemessen sein.
- Gibt es eine Referenz für diesen Ansatz? Der Name dieser Methode? Vielen Dank.
Antwort
MAPE finden,
Es ist ein sehr umstrittenes Thema, und viele OpenSource-Mitwirkende haben das obige Thema erörtert. Der bisher effizienteste Ansatz wird von den Entwicklern verfolgt. Weitere Informationen finden Sie in dieser PR .
Antwort
Wenn Sie darüber nachdenken, vergleichen Sie Äpfel mit Orangen, wenn Sie den relativen Fehler mit dem von Null gemessenen Fehler vergleichen, da der von Null gemessene Fehler dem gemessenen Wert entspricht (deshalb Sie Wenn Sie durch die Testnummer dividieren, erhalten Sie einen Fehler von 100%.
Betrachten Sie beispielsweise den Messfehler des Manometerdrucks (des relativen Drucks aus der Atmosphäre) gegenüber dem absoluten Druck. Angenommen, Sie verwenden ein Instrument, um den Manometerdruck bei perfekten atmosphärischen Bedingungen zu messen, und Ihr Gerät hat den atmosphärischen Druck vor Ort gemessen, sodass ein Fehler von 0% aufgezeichnet werden sollte. Verwenden Sie die von Ihnen angegebene Gleichung und nehmen Sie zunächst an, dass wir den gemessenen Manometerdruck verwendet haben, um den relativen Fehler zu berechnen: $$ \ text {relativer Fehler} = \ frac {P_ {Manometer, wahr} – P_ {Messgerät, Test}} {P_ {Messgerät, wahr}} $$ Dann $ P_ {Messgerät, wahr} = 0 $ und $ P_ {Messgerät, Test} = 0 $ und Sie erhalten keinen 0% -Fehler, stattdessen ist es undefiniert. Dies liegt daran, dass der tatsächliche prozentuale Fehler die absoluten Druckwerte wie folgt verwenden sollte: $$ \ text {relativer Fehler} = \ frac {P_ {absolut, wahr} -P_ {absolut, test}} {P_ {absolut, wahr}} $$ Jetzt $ P_ {absolut, wahr} = 1atm $ und $ P_ {absolute, test} = 1atm $ und Sie erhalten 0% Fehler. Dies ist die richtige Anwendung des relativen Fehlers. Die ursprüngliche Anwendung, bei der Überdruck verwendet wurde, war eher ein „relativer Fehler des relativen Werts“, was sich von „relativer Fehler“ unterscheidet. Sie müssen den Manometerdruck in absolut umwandeln, bevor Sie den relativen Fehler messen.
Die Lösung für Ihre Frage besteht darin, sicherzustellen, dass Sie bei der Messung des relativen Fehlers mit absoluten Werten arbeiten, damit Null nicht möglich ist. Dann erhalten Sie tatsächlich einen relativen Fehler und können diesen als Unsicherheit oder Metrik Ihres realen prozentualen Fehlers verwenden. Wenn Sie sich an relative Werte halten müssen, sollten Sie einen absoluten Fehler verwenden, da sich der relative (prozentuale) Fehler abhängig von Ihrem Referenzpunkt ändert.
Es ist schwierig, eine konkrete Definition auf 0 zu setzen. .. „Null ist die mit 0 bezeichnete Ganzzahl, die bei Verwendung als Zählzahl bedeutet, dass keine Objekte vorhanden sind.“ – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html
Fühlen Sie sich frei, nicht zu wählen, aber Null bedeutet im Wesentlichen nichts, es ist nicht da. Deshalb ist es nicht sinnvoll, bei der Berechnung des relativen Fehlers Manometerdruck zu verwenden. Manometerdruck Obwohl dies nützlich ist, wird davon ausgegangen, dass bei atmosphärischem Druck nichts vorhanden ist. Wir wissen jedoch, dass dies nicht der Fall ist, da es einen absoluten Druck von 1 atm hat. Somit existiert der relative Fehler in Bezug auf nichts einfach nicht, er ist undefiniert
Sie können sich einfach dagegen aussprechen, einfach ausgedrückt: Schnellkorrekturen, wie das Hinzufügen einer zum unteren Wert, sind fehlerhaft und nicht genau. Sie können immer noch nützlich sein, wenn Sie lediglich versuchen, Fehler zu minimieren. Wenn Sie jedoch versuchen, die Unsicherheit genau zu messen, nicht so sehr …