Comment calculer lerreur relative lorsque la valeur vraie est zéro?

Disons que jai $ x_ {true} = 0 $ et $ x_ {test} $. Si je définis lerreur relative comme suit:

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $

Alors lerreur relative nest toujours pas définie. Si à la place jutilise la définition:

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $

Alors lerreur relative est toujours de 100%. Les deux méthodes semblent inutiles. Y a-t-il une autre alternative?

Commentaires

  • Javais exactement la même question concernant le biais de paramètre dans les simulations de Monte Carlo, en utilisant votre première définition. Une de mes valeurs de paramètre était 0, donc je nai pas ‘ calculer le biais de paramètre pour ce paramètre particulier …
  • La solution est de ne pas utiliser derreur relative dans ce cas.

Réponse

Il existe de nombreuses alternatives , selon le but.


La « différence relative en pourcentage », ou RPD, utilisée dans les procédures de contrôle qualité en laboratoire est la plus courante. Bien que vous puissiez trouver de nombreuses formules apparemment différentes, elles se résument toutes à comparer la différence de deux valeurs à leur magnitude moyenne:

$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$

Il sagit dune expression signée , positive lorsque $ x $ dépasse $ y $ et négative lorsque $ y $ dépasse $ x $. Sa valeur se situe toujours entre -2 $ et 2 $. En utilisant des valeurs absolues dans le dénominateur, il gère les nombres négatifs de manière raisonnable. La plupart des références que je peux trouver, telles que les New Jersey DEP Site Remediation Program, Évaluation de la qualité des données et Guide technique dévaluation de lutilisabilité des données , utilisent la valeur absolue de $ d_1 $ parce quils ne sont intéressés que par lampleur de lerreur relative.


Un article Wikipedia sur Changement relatif et différence observe que

$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$

est fréquemment utilisé comme test de tolérance relative dans les algorithmes numériques à virgule flottante. Le même article souligne également que des formules comme $ d_1 $ et $ d_ \ infty $ peuvent être généralisées à

$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$

où la fonction $ f $ dépend directement des grandeurs de $ x $ et $ y $ (en supposant généralement que $ x $ et $ y $ sont positifs). À titre dexemple, il offre leurs moyennes max, min et arithmétique (avec et sans prendre les valeurs absolues de $ x $ et $ y $ elles-mêmes), mais on pourrait envisager dautres sortes de moyennes telles que la moyenne géométrique $ \ sqrt {| xy |} $, la moyenne harmonique $ 2 / (1 / | x | + 1 / | y |) $ et $ L ^ p $ signifie $ ((| x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ correspond à $ p = 1 $ et $ d_ \ infty $ correspond à la limite comme $ p \ to \ infty $.) On pourrait choisir un $ f $ basé sur le comportement statistique attendu de $ x $ et $ y $. Par exemple, avec des distributions approximativement log-normales, la moyenne géométrique serait un choix attrayant pour $ f $ car cest une moyenne significative dans ce cas.


La plupart de ces formules rencontrent des difficultés lorsque le dénominateur est égal à zéro. Dans de nombreuses applications, ce nest pas possible ou il est inoffensif de définir la différence à zéro lorsque $ x = y = 0 $.

Notez que toutes ces définitions partagent une invariance fondamentale propriété: quelle que soit la fonction de différence relative $ d $, elle ne change pas lorsque les arguments sont uniformément redimensionnés par $ \ lambda \ gt 0 $:

$$ d (x, y) = d ( \ lambda x, \ lambda y). $$

Cest cette propriété qui nous permet de considérer $ d $ comme une différence relative . Ainsi, en particulier, une fonction non invariante comme

$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$

nest tout simplement pas admissible. Quelles que soient ses vertus, il nexprime pas une différence relative.


Lhistoire ne sarrête pas là. Nous pourrions même trouver utile de pousser un peu plus loin les implications de linvariance.

Lensemble des toutes les paires ordonnées de nombres réels $ (x, y) \ ne (0,0) $ où $ (x, y) $ est considéré comme identique à $ (\ lambda x, \ lambda y) $ est le Ligne projective réelle $ \ mathbb {RP} ^ 1 $. Au sens topologique et algébrique, $ \ mathbb {RP} ^ 1 $ est un cercle. Tout $ (x, y) \ ne (0,0) $ détermine une ligne unique passant par lorigine $ (0,0) $. Quand $ x \ ne 0 $ sa pente est $ y / x $; sinon nous pouvons considérer sa pente comme « infinie » (et soit négative soit positive). Un voisinage de cette ligne verticale est constitué de lignes avec des pentes négatives positives extrêmement importantes ou extrêmement grandes. Nous pouvons paramétrer toutes ces lignes en fonction de leur angle $ \ theta = \ arctan (y / x) $, avec $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $.Un point sur le cercle est associé à chaque $ \ theta $,

$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ gauche (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ droite). $$

Toute distance définie sur le cercle peut donc être utilisée pour définir une différence relative.

Comme exemple doù cela peut mener, considérons la distance habituelle (euclidienne) sur le cercle, la distance entre deux points étant la taille de langle entre eux. La différence relative est moindre lorsque $ x = y $, correspondant à $ 2 \ theta = \ pi / 2 $ (ou $ 2 \ theta = -3 \ pi / 2 $ lorsque $ x $ et $ y $ ont des signes opposés). De ce point de vue, une différence relative naturelle pour les nombres positifs $ x $ et $ y $ serait la distance à cet angle:

$$ d_S (x, y) = \ left | 2 \ arctan \ left (\ frac {y} {x} \ right) – \ pi / 2 \ right |. $$

Pour le premier ordre, cest la distance relative $ | xy | / | y | $ – -mais ça marche même quand $ y = 0 $. De plus, il nexplose pas, mais à la place (en tant que distance signée) est limité entre $ – \ pi / 2 $ et $ \ pi / 2 $, comme lindique ce graphique:

Figure

Cela montre à quel point les choix sont flexibles lors de la sélection dun moyen de mesurer les différences relatives.

Commentaires

  • Merci pour la réponse complète, quelle est selon vous la meilleure référence pour cette ligne:  » est fréquemment utilisé comme test de tolérance relative dans les algorithmes numériques à virgule flottante. Le même article souligne également que des formules telles que d1d1 et d∞d∞ peuvent être généralisées à  »
  • @Hammad Avez-vous suivi le lien vers larticle Wikipedia?
  • Ouais! Jai jeté un coup dœil sur Wikipedia; je pense que ‘ s pas une référence réelle (cette ligne est également sans aucune référence sur le wiki)
  • btw, sans souci jai trouvé une référence académique pour cela 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
  • @KutalmisB Merci davoir remarqué que: le  » min  » ny appartient pas ‘ du tout. Il semble que cela ait pu être le vestige dune formule plus complexe qui traitait tous les signes possibles de $ x $ et $ y $ que jai simplifiés plus tard. Je lai supprimé.

Réponse

Tout dabord, notez que vous prenez généralement la valeur absolue dans le calcul du relatif Erreur.

Une solution courante au problème consiste à calculer

$$ \ text {relative error} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$

Commentaires

  • Ceci est problématique dans la mesure où cela varie en fonction des unités de mesure choisies pour les valeurs.
  • Que ‘ est absolument vrai. Ce nest pas ‘ une solution parfaite au problème, mais cest une approche courante qui fonctionne raisonnablement bien lorsque $ x $ est bien mis à léchelle.
  • Pourriez-vous élaborer dans votre réponse sur ce que vous entendez par  » bien mis à léchelle « ? Par exemple, supposons que les données proviennent de létalonnage dun système de mesure chimique aqueux conçu pour des concentrations comprises entre 0 $ et 0,000001 $ moles / litre pouvant atteindre une précision de, disons, trois chiffres significatifs. Votre  » erreur relative  » serait donc constamment nulle sauf pour des mesures manifestement erronées. À la lumière de cela, comment redimensionner exactement ces données?
  • Votre exemple est celui où la variable nest ‘ pas bien mise à léchelle. Par  » bien mis à léchelle « , je veux dire que cette variable est mise à léchelle de manière à prendre des valeurs dans une petite plage (par exemple, un couple dordres de grandeur) près de 1. Si votre variable prend des valeurs de plusieurs ordres de grandeur, alors vous ‘ avez des problèmes de mise à léchelle plus graves et cette approche simple nest ‘ ne sera pas suffisant.
  • Une référence pour cette approche? Le nom de cette méthode? Merci.

Réponse

MAPE Formula

Recherche de MAPE,

Cest un sujet très discutable et de nombreux contributeurs open source ont discuté du sujet ci-dessus. Lapproche la plus efficace à ce jour est suivie par les développeurs. Veuillez consulter ce PR pour en savoir plus.

Réponse

Jétais un peu confus à ce sujet pendant un moment. En fin de compte, cest parce que si vous essayez de mesurer lerreur relative par rapport à zéro, vous essayez de forcer quelque chose qui nexiste tout simplement pas.

Si vous y réfléchissez, vous comparez des pommes à des oranges lorsque vous comparez lerreur relative à lerreur mesurée à partir de zéro, car lerreur mesurée à partir de zéro équivaut à la valeur mesurée (cest pourquoi vous obtenir une erreur de 100% lorsque vous divisez par le nombre de test).

Par exemple, envisagez de mesurer lerreur de la pression relative (la pression relative par rapport à la pression atmosphérique) par rapport à la pression absolue. Supposons que vous utilisez un instrument pour mesurer la pression manométrique dans des conditions atmosphériques parfaites, et que votre appareil a mesuré la pression atmosphérique sur place pour enregistrer une erreur de 0%. En utilisant léquation que vous avez fournie, et en supposant dabord que nous avons utilisé la pression relative mesurée, pour calculer lerreur relative: $$ \ text {relative error} = \ frac {P_ {gauge, true} – P_ {gauge, test}} {P_ {gauge, true}} $$ Puis $ P_ {gauge, true} = 0 $ et $ P_ {gauge, test} = 0 $ et vous nobtenez pas 0% derreur, au lieu de cela, il nest pas défini. En effet, le pourcentage derreur réel doit utiliser les valeurs de pression absolues comme celle-ci: $$ \ text {relative error} = \ frac {P_ {absolu, vrai} -P_ {absolu, test}} {P_ {absolute, true}} $$ Maintenant $ P_ {absolute, true} = 1atm $ et $ P_ {absolu, test} = 1atm $ et vous obtenez une erreur de 0%. Cest la bonne application de lerreur relative. Lapplication dorigine qui utilisait la pression relative était plutôt une «erreur relative de la valeur relative», ce qui est une chose différente de «lerreur relative». Vous devez convertir la pression relative en valeur absolue avant de mesurer lerreur relative.

La solution à votre question est de vous assurer que vous avez affaire à des valeurs absolues lors de la mesure de lerreur relative, de sorte que zéro nest pas une possibilité. Ensuite, vous obtenez en fait une erreur relative et pouvez lutiliser comme une incertitude ou une métrique de votre pourcentage derreur réel. Si vous devez vous en tenir aux valeurs relatives, vous devriez utiliser une erreur absolue, car lerreur relative (en pourcentage) changera en fonction de votre point de référence.

Il est difficile de mettre une définition concrète sur 0. .. « Zéro est lentier noté 0 qui, lorsquil est utilisé comme nombre de comptage, signifie quaucun objet nest présent. » – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html

Nhésitez pas à choisir, mais zéro ne signifie essentiellement rien, ce nest pas là. Cest pourquoi il na pas de sens dutiliser la pression manométrique pour calculer lerreur relative. Pression manométrique , bien quutile, suppose quil ny a rien à la pression atmosphérique. Nous savons que ce nest pas le cas, car il a une pression absolue de 1 atm. Ainsi, lerreur relative par rapport à rien, nexiste tout simplement pas, elle est indéfinie .

Nhésitez pas à vous opposer à cela, en termes simples: toute solution rapide, telle que lajout dune valeur inférieure, est défectueuse et imprécise. Ils peuvent être encore utiles si vous essayez simplement de minimiser les erreurs. Si vous essayez de mesurer précisément lincertitude, pas tellement …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *