真の値がゼロの場合の相対誤差を計算するにはどうすればよいですか?

$ x_ {true} = 0 $であるとします。 $ x_ {test} $。相対誤差を次のように定義すると、

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $

相対誤差は常に未定義です。代わりに次の定義を使用する場合:

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $

次に、相対誤差は常に100%です。どちらの方法も役に立たないようです。別の選択肢はありますか?

コメント

  • 最初の定義を使用して、モンテカルロシミュレーションのパラメーターバイアスに関してまったく同じ質問がありました。パラメータ値の1つが0だったので、'この特定のパラメータのパラメータバイアスを計算しませんでした…
  • 解決策は、で相対誤差を使用しないことです。この場合。

回答

多くの選択肢があります、目的に応じて。


一般的なものは、ラボの品質管理手順で使用される「相対パーセント差」(RPD)です。一見異なる数式をたくさん見つけることができますが、それらはすべて、2つの値の差を平均の大きさと比較することになります。

$$ d_1(x、y)= \ frac {x –y} {( | x | + | y |)/ 2} = 2 \ frac {x –y} {| x | + | y |}。$$

これは符号付き式で、$ x $が$ y $を超えると正になり、$ y $が$ x $を超えると負になります。その値は常に$ -2 $から$ 2 $の間にあります。分母に絶対値を使用することにより、負の数を合理的な方法で処理します。 ニュージャージーDEPサイト修復プログラムのデータ品質評価とデータ使用可能性評価の技術ガイダンスなど、私が見つけることができるほとんどの参照では、$ d_1の絶対値を使用しています。 $は、相対誤差の大きさのみに関心があるためです。


相対的な変化と差異に関するWikipediaの記事 em

$$ d_ \ infty(x、y)= \ frac {| x –y |} {\ max(| x |、| y |)} $$

は、浮動小数点数値アルゴリズムの相対許容誤差テストとして頻繁に使用されます。同じ記事では、$ d_1 $や$ d_ \ infty $のような式は次のように一般化できることも指摘しています

$$ d_f(x、y)= \ frac {x –y} {f(x、 y)} $$

ここで、関数$ f $は$ x $と$ y $の大きさに直接依存します(通常、$ x $と$ y $が正であると仮定します)。例として、最大、最小、および算術平均($ x $および$ y $自体の絶対値を取得する場合と取得しない場合)を提供しますが、幾何平均$ \ sqrt {| xyなどの他の種類の平均を検討することもできます。 |} $、調和平均$ 2 /(1 / | x | + 1 / | y |)$および$ L ^ p $は$((| x | ^ p + | y | ^ p)/ 2)^ {を意味します1 / p} $。 ($ d_1 $は$ p = 1 $に対応し、$ d_ \ infty $は$ p \ to \ infty $としての制限に対応します。)$ x $と$の予想される統計的動作に基づいて$ f $を選択できます。 y $。たとえば、ほぼ対数正規分布の場合、幾何平均はその状況で意味のある平均であるため、$ f $にとって魅力的な選択肢になります。


これらの式のほとんどは、分母が等しい場合に問題が発生します。ゼロ。多くのアプリケーションでは、$ x = y = 0 $の場合、差をゼロに設定することは不可能であるか、無害です。

これらの定義はすべて 基本的な不変性を共有していることに注意してください。プロパティ:相対差分関数$ d $が何であれ、引数が$ \ lambda \ gt 0 $によって均一に再スケーリングされても変化しません:

$$ d(x、y)= d( \ lambda x、\ lambda y)。$$

$ d $を相対的な違いと見なすことができるのはこのプロパティです。したがって、特に、

$$ d(x、y)=?\ \ frac {| xy |} {1 + | y |} $$

<のような不変関数p>単に資格がありません。それが持つ美徳が何であれ、それは相対的な違いを表現しません。


物語はここで終わりではありません。 不変性の影響をもう少し推し進めることが有益であると感じるかもしれません。

一連の実数のすべての順序対$(x、y)\ ne(0,0)$ここで、$(x、y)$は$(\ lambda x、\ lambda y)$と同じであると見なされます実射影直線 $ \ mathbb {RP} ^ 1 $。位相幾何学的な意味と代数的な意味の両方で、$ \ mathbb {RP} ^ 1 $は円です。 $(x、y)\ ne(0,0)$は、原点$(0,0)$を通る一意の線を決定します。 $ x \ ne 0 $の場合、その傾きは$ y / x $です。そうでなければ、その傾きは「無限」(そして負または正のいずれか)であると見なすことができます。この垂直線の近傍は、非常に大きな正または非常に大きな負の勾配を持つ線で構成されます。 $-\ pi / 2 \ lt \ theta \ le \ pi / 2 $を使用して、そのようなすべての線を角度$ \ theta = \ arctan(y / x)$でパラメーター化できます。そのようなすべての$ \ theta $に関連付けられているのは、円上の点です。

$$(\ xi、\ eta)=(\ cos(2 \ theta)、\ sin(2 \ theta))= \ left(\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}、\ frac {2xy} {x ^ 2 + y ^ 2} \ right)。$$

円で定義された距離は、相対的な差を定義するために使用できます。

これがつながる可能性のある例として、円上の通常の(ユークリッド)距離を考えてみましょう。2点間の距離は、それらの間の角度のサイズです。相対的な差は、$ x = y $の場合に最小になり、$ 2 \ theta = \ pi / 2 $に対応します(または$ x $と$ y $の符号が反対の場合は$ 2 \ theta = -3 \ pi / 2 $)。この観点から、正の数$ x $と$ y $の自然な相対差は、この角度までの距離になります。

$$ d_S(x、y)= \ left | 2 \ arctan \ left(\ frac {y} {x} \ right)-\ pi / 2 \ right |。$$

一次的には、これは相対距離$ | xy | / | y | $- -ただし、$ y = 0 $の場合でも機能します。さらに、それは爆発しませんが、代わりに(符号付き距離として)$-\ pi / 2 $と$ \ pi / 2 $の間に制限されます。これは、このグラフが示すように:

図

これは、相対的な差異を測定する方法を選択する際の選択肢の柔軟性を示しています。

コメント

  • 包括的な回答をありがとうございます。この行の最良の参照は何だと思いますか:"は、浮動小数点数値アルゴリズムの相対許容誤差テストとして頻繁に使用されます。同じ記事では、d1d1やd∞d∞などの式が"
  • @Hammad Wikipediaの記事へのリンクをたどりましたか?
  • ええ!私はWikipediaを調べました。'だと思います。実際の参照ではありません(また、その行にはwikiに参照がありません)
  • ところで、これに関する学術的な参照を見つけたことを忘れないでください:) tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
  • @KutalmisB次のことに気づいていただきありがとうございます:" min "は'そこにはまったく属していません。後で簡略化した$ x $と$ y $のすべての可能な符号を処理した、より複雑な数式の痕跡だったようです。削除しました。

回答

まず、相対値の計算では通常、絶対値を使用することに注意してください。エラー。

この問題の一般的な解決策は、計算することです

$$ \ text {relative error} = \ frac {\ left | x _ {\ text {true}}-x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}。$$

コメント

  • これは、値に選択した測定単位によって異なるという点で問題があります。
  • その' sは絶対に真実です。これは'問題の完全な解決策ではありませんが、$ x $が適切にスケーリングされている場合に適切に機能する一般的なアプローチです。
  • 詳しく説明していただけますか"適切にスケーリングされた"の意味についてのあなたの答えは?たとえば、データが、たとえば有効数字3桁の精度を達成できる$ 0 $〜$ 0.000001 $モル/リットルの濃度用に設計された水性化学測定システムのキャリブレーションから生じたとします。したがって、"相対誤差"は、明らかに誤った測定値を除いて、常にゼロになります。これに照らして、そのようなデータをどの程度正確に再スケーリングしますか?
  • あなたの例は、変数が適切にスケーリングされていない'例です。 "適切にスケーリングされた"とは、その変数が小さな範囲(たとえば、カップルなど)の値をとるようにスケーリングされることを意味します。変数があなたよりも何桁も大きい値をとる場合'より深刻なスケーリングの問題が発生し、この単純なアプローチは'適切ではありません。
  • このアプローチの参考資料はありますか?このメソッドの名前は?ありがとうございます。

回答

MAPE式

MAPEの検索

これは非常に議論の余地のあるトピックであり、多くのオープンソースの貢献者が上記のトピックについて議論しています。これまでで最も効率的なアプローチは、開発者が従います。詳細については、このPR を参照してください。

回答

私はしばらくこれについて少し混乱していました。結局のところ、ゼロに関する相対誤差を測定しようとしている場合は、単に存在しないものを強制しようとしているためです。

考えてみると、相対誤差をゼロから測定した誤差と比較すると、リンゴとオレンジを比較していることになります。ゼロから測定した誤差は測定値と同等だからです(そのため、テスト番号で割ると100%の誤差が生じます。

たとえば、ゲージ圧(大気圧からの相対圧力)と絶対圧の測定誤差を検討します。計器を使用して完全な大気条件でゲージ圧を測定し、デバイスが0%の誤差を記録するように大気圧スポットを測定したとします。指定した式を使用し、最初に測定されたゲージ圧を使用したと仮定して、相対誤差を計算します。 $$ \ text {relative error} = \ frac {P_ {gauge、true}- P_ {gauge、test}} {P_ {gauge、true}} $$ 次に、 $ P_ {gauge、true} = 0 $ および $ P_ {gauge、test} = 0 $ で、0%のエラーは発生せず、代わりに未定義です。これは、実際のパーセント誤差が次のような絶対圧力値を使用する必要があるためです。 $$ \ text {relative error} = \ frac {P_ {absolute、true} -P_ {absolute、 test}} {P_ {absolute、true}} $$ 今度は $ P_ {absolute、true} = 1atm $ と $ P_ {absolute、test} = 1atm $ とすると、0%のエラーが発生します。これは、相対誤差の適切な適用です。ゲージ圧を使用した元のアプリケーションは、「相対誤差」とは異なる「相対値の相対誤差」に似ていました。相対誤差を測定する前に、ゲージ圧を絶対値に変換する必要があります。

質問の解決策は、相対誤差を測定するときに絶対値を扱っていることを確認することです。これにより、ゼロが発生する可能性はなくなります。次に、実際に相対誤差が発生し、それを不確実性または実際のパーセント誤差のメトリックとして使用できます。相対(パーセント)誤差は参照点によって変化するため、絶対誤差を使用するよりも相対値に固執する必要がある場合。

0に具体的な定義を付けるのは困難です。 ..「ゼロは0で表される整数であり、カウント数として使用される場合、オブジェクトが存在しないことを意味します。」-Wolfram MathWorld http://mathworld.wolfram.com/Zero.html

自由にピックを選択できますが、ゼロは本質的に何も意味せず、存在しません。そのため、相対誤差を計算するときにゲージ圧力を使用することは意味がありません。ゲージ圧力は有用ですが、大気圧では何もないと想定しています。絶対圧力が1 atmであるため、そうではないことはわかっています。したがって、何もないことに関する相対誤差は存在せず、未定義です。 。

これに異議を唱えるのは自由です。簡単に言えば、一番下の値に1を追加するなどの簡単な修正は誤りであり、正確ではありません。エラーを最小限に抑えようとしているだけの場合でも、これらは便利です。ただし、不確かさを正確に測定しようとしている場合は、それほど多くはありません…

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です