진정한 값이 0 일 때 상대 오차를 어떻게 계산하나요?

$ x_ {true} = 0 $이고 $ x_ {test} $. 상대 오류를 다음과 같이 정의하면 :

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $

그런 다음 상대 오류는 항상 정의되지 않습니다. 대신 정의를 사용하는 경우 :

$ \ text {relative error} = \ frac {x_ {true} -x_ {test}} {x_ {test}} $

그런 다음 상대 오차는 항상 100 %입니다. 두 방법 모두 쓸모없는 것 같습니다. 다른 대안이 있습니까?

댓글

  • 첫 번째 정의를 사용하여 Monte Carlo 시뮬레이션의 매개 변수 편향에 대해 똑같은 질문을했습니다. 내 매개 변수 값 중 하나가 0 이었으므로 ‘이 특정 매개 변수에 대한 매개 변수 편향을 계산하지 않았습니다 …
  • 해결 방법은 이 경우입니다.

답변

많은 대안이 있습니다. , 목적에 따라 다릅니다.


일반적인 것은 실험실 품질 관리 절차에 사용되는 “상대 비율 차이”또는 RPD입니다. 겉보기에 다른 많은 공식을 찾을 수 있지만 모두 두 값의 차이를 평균 크기와 비교합니다.

$$ d_1 (x, y) = \ frac {x-y} {( | x | + | y |) / 2} = 2 \ frac {x-y} {| x | + | y |}. $$

이것은 부호 된 표현식으로, $ x $가 $ y $를 초과하면 양수이고 $ y $가 $ x $를 초과하면 음수입니다. 그 값은 항상 $ -2 $에서 $ 2 $ 사이입니다. 분모에 절대 값을 사용하여 합리적인 방식으로 음수를 처리합니다. 뉴저지 DEP 사이트 개선 프로그램 데이터 품질 평가 및 데이터 유용성 평가 기술 지침 과 같이 내가 찾을 수있는 대부분의 참조는 절대 값 $ d_1을 사용합니다. $는 상대 오차의 크기에만 관심이 있기 때문입니다.


상대적 변화 및 차이 em에 대한 Wikipedia 기사 >

$$ d_ \ infty (x, y) = \ frac {| x-y |} {\ max (| x |, | y |)} $$

는 부동 소수점 수치 알고리즘에서 상대 허용 오차 테스트로 자주 사용됩니다. 같은 기사는 또한 $ d_1 $ 및 $ d_ \ infty $와 같은 공식이 다음과 같이 일반화 될 수 있다고 지적합니다.

$$ d_f (x, y) = \ frac {x-y} {f (x, y)} $$

여기서 $ f $ 함수는 $ x $ 및 $ y $의 크기에 직접적으로 의존합니다 (보통 $ x $ 및 $ y $가 양수라고 가정). 예를 들어 최대, 최소 및 산술 평균을 제공하지만 ($ x $ 및 $ y $ 자체의 절대 값을 사용하거나 사용하지 않음) 기하 평균 $ \ sqrt {| xy와 같은 다른 종류의 평균을 고려할 수 있습니다. |} $, 조화 평균 $ 2 / (1 / | x | + 1 / | y |) $ 및 $ L ^ p $는 $ ((| x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $는 $ p = 1 $에 해당하고 $ d_ \ infty $는 $ p \ to \ infty $에 해당하는 한도에 해당합니다.) $ x $ 및 $의 예상 통계 동작에 따라 $ f $를 선택할 수 있습니다 y $. 예를 들어, 대략 로그 정규 분포를 사용하는 경우 기하 평균은 $ f $에 대한 매력적인 선택이 될 것입니다. 그 상황에서 의미있는 평균이기 때문입니다.


이러한 공식의 대부분은 분모가 같을 때 어려움을 겪습니다. 제로. 많은 애플리케이션에서 $ x = y = 0 $ 일 때 차이를 0으로 설정하는 것이 불가능하거나 무해합니다.

이러한 정의는 모두 근본적인 불변성을 공유합니다. 속성 : $ d $의 상대적 차이 함수가 무엇이든, 인수가 $ \ lambda \ gt 0 $에 의해 균일하게 크기 조정될 때 변경되지 않습니다.

$$ d (x, y) = d ( \ lambda x, \ lambda y). $$

$ d $를 상대적 차이로 간주 할 수있는 것은이 속성입니다. 따라서 특히

$$ d (x, y) =? \ \ frac {| xy |} {1 + | y |} $$

단순히 자격이 없습니다. 미덕이 무엇이든간에 상대적인 차이를 표현하지 않습니다 .


이야기는 여기서 끝나지 않습니다. 불변의 의미를 조금 더 밀어 붙이는 것이 유익 할 수도 있습니다.

순서가 지정된 모든 실수 쌍 $ (x, y) \ ne (0,0) $ 여기서 $ (x, y) $는 $ (\ lambda x, \ lambda y) $는 실제 투영 선 $ \ mathbb {RP} ^ 1 $. 위상 적 의미와 대수적 의미 모두에서 $ \ mathbb {RP} ^ 1 $은 원입니다. 모든 $ (x, y) \ ne (0,0) $는 오리진 $ (0,0) $를 통과하는 고유 한 라인을 결정합니다. $ x \ ne 0 $ 일 때 기울기는 $ y / x $입니다. 그렇지 않으면 기울기가 “무한”(음수 또는 양수)으로 간주 할 수 있습니다. 이 수직선의 이웃은 매우 큰 양의 경사 또는 매우 큰 음의 경사가있는 선으로 구성됩니다. $-\ pi / 2 \ lt \ theta \ le \ pi / 2 $를 사용하여 각도 $ \ theta = \ arctan (y / x) $로 이러한 모든 선을 매개 변수화 할 수 있습니다.이러한 모든 $ \ theta $는 원의 한 점입니다.

$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ left (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ right). $$

거리를 사용하여 상대적 차이를 정의 할 수 있습니다.

이것이 어디로 이어질 수 있는지에 대한 예로, 원의 일반적인 (유클리드) 거리를 고려하십시오. 두 점 사이의 거리는 두 점 사이의 각도 크기입니다. 상대적 차이는 $ x = y $ 일 때 가장 적으며, $ 2 \ theta = \ pi / 2 $에 해당합니다 (또는 $ x $와 $ y $에 반대 부호가있는 경우 $ 2 \ theta = -3 \ pi / 2 $). 이 관점에서 양수 $ x $ 및 $ y $에 대한 자연적인 상대적 차이는이 각도까지의 거리입니다.

$$ d_S (x, y) = \ left | 2 \ arctan \ left (\ frac {y} {x} \ right)-\ pi / 2 \ right |. $$

첫 번째 순서로, 이것은 상대 거리 $ | xy | / | y | $- -하지만 $ y = 0 $ 일 때도 작동합니다. 또한이 그래프는 다음과 같이 폭발하지 않지만 대신 $-\ pi / 2 $에서 $ \ pi / 2 $ 사이로 제한됩니다.

그림

상대 차이를 측정하는 방법을 선택할 때 선택이 얼마나 유연한 지 알 수 있습니다.

댓글

  • 포괄적 인 답변에 감사드립니다.이 줄에 대한 최상의 참조가 무엇이라고 생각하십니까? “는 부동 소수점 수치 알고리즘에서 상대 허용 오차 테스트로 자주 사용됩니다. 동일한 문서에서는 d1d1 및 d∞d∞와 같은 공식이 ” 로 일반화 될 수 있음을 지적합니다. li>
  • @Hammad 위키피디아 기사 링크를 따라 갔나 요?
  • 예! 위키피디아를 살펴 봤는데 ‘ 실제 참조가 아닙니다 (또한 그 줄은 위키에 대한 참조가 없습니다)
  • btw, 이것에 대한 학술 참조를 찾았습니다 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
  • @KutalmisB 알아 주셔서 감사합니다. ” min “은 ‘ 전혀 속하지 않습니다. 나중에 단순화 한 $ x $ 및 $ y $의 모든 가능한 기호를 처리 한 더 복잡한 공식의 흔적이었던 것 같습니다. 제거했습니다.

Answer

먼저, 일반적으로 상대를 계산할 때 절대 값을 사용합니다. 오류.

이 문제에 대한 일반적인 해결책은 다음을 계산하는 것입니다.

$$ \ text {상대 오류} = \ frac {\ left | x _ {\ text {true}}-x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$

댓글

  • 값에 대해 선택한 측정 단위에 따라 달라진다는 점에서 문제가 있습니다.
  • 그 ‘는 절대적으로 사실입니다. 이 방법은 ‘ 문제에 대한 완벽한 해결책은 아니지만 $ x $가 잘 확장 될 때 합리적으로 잘 작동하는 일반적인 접근 방식입니다.
  • 자세히 설명해 주시겠습니까? ” 확장 된 “의 의미에 대한 귀하의 답변은? 예를 들어, 데이터가 $ 0 $에서 $ 0.000001 $ moles / liter 사이의 농도로 설계된 수성 화학 측정 시스템의 보정에서 발생했다고 가정 해 보겠습니다. 따라서 ” 상대 오류 “는 명백하게 잘못된 측정을 제외하고는 항상 0이됩니다. 이를 고려하여 이러한 데이터의 크기를 정확히 어떻게 재조정 하시겠습니까?
  • 변수의 크기가 잘 조정되지 않은 ‘ 예를들 수 있습니다. ” 확장 된 ” 란 변수가 작은 범위 (예 : 당신의 변수가 당신보다 훨씬 더 많은 값을 갖는 경우 ‘ 더 심각한 스케일링 문제가 있고이 간단한 접근 방식은 ‘ 적절하지 않습니다.
  • 이 접근 방식에 대한 참조가 있습니까? 이 방법의 이름? 감사합니다.

답변

MAPE 공식

MAPE 찾기

매우 논쟁의 여지가있는 주제이며 많은 오픈 소스 기고자들이 위 주제에 대해 논의했습니다. 지금까지 가장 효율적인 접근 방식은 개발자가 따릅니다. 자세한 내용은 이 PR 을 참조하세요.

답변

나는 이것에 대해 잠시 혼란 스러웠습니다. 결국, 0에 대한 상대 오차를 측정하려고한다면 단순히 존재하지 않는 무언가를 강요하려고하기 때문입니다.

생각해 보면 0에서 측정 한 오류와 0에서 측정 한 오류를 비교할 때 사과와 오렌지를 비교하는 것입니다. 왜냐하면 0에서 측정 한 오류는 측정 된 값과 동일하기 때문입니다. 테스트 번호로 나눌 때 100 % 오류가 발생합니다.

예를 들어 게이지 압력 (대기압의 상대 압력)과 절대 압력의 측정 오류를 고려해보십시오. 기기를 사용하여 완벽한 대기 조건에서 게이지 압력을 측정하고 장치에서 대기압 지점을 측정하여 0 % 오류를 기록한다고 가정 해 보겠습니다. 제공 한 방정식을 사용하고 먼저 측정 된 게이지 압력을 사용했다고 가정하고 상대 오차를 계산합니다. $$ \ text {relative error} = \ frac {P_ {gauge, true}- P_ {gauge, test}} {P_ {gauge, true}} $$ 그런 다음 $ P_ {gauge, true} = 0 $ $ P_ {gauge, test} = 0 $ 그리고 0 % 오류가 발생하지 않고 대신 정의되지 않았습니다. 실제 백분율 오류는 다음과 같은 절대 압력 값을 사용해야하기 때문입니다. $$ \ text {상대 오류} = \ frac {P_ {absolute, true} -P_ {absolute, test}} {P_ {absolute, true}} $$ 이제 $ P_ {absolute, true} = 1atm $ $ P_ {absolute, test} = 1atm $ 이고 0 % 오류가 발생합니다. 이것은 상대 오류의 적절한 적용입니다. 게이지 압력을 사용한 원래 응용 프로그램은 “상대 오차”와는 다른 “상대 값의 상대적 오차”에 가깝습니다. 상대 오차를 측정하기 전에 게이지 압력을 절대 값으로 변환해야합니다.

문제에 대한 해결책은 상대 오차를 측정 할 때 절대 값을 처리하고 있는지 확인하여 0이 가능성이되지 않도록하는 것입니다. 그러면 실제로 상대 오차가 발생하고이를 불확실성 또는 실제 백분율 오차의 척도로 사용할 수 있습니다. 상대 값을 고수해야한다면 절대 오차를 사용해야합니다. 상대 (퍼센트) 오차는 기준점에 따라 달라지기 때문입니다.

0에 구체적인 정의를 지정하는 것은 어렵습니다. .. “0은 0으로 표시되는 정수로, 계수 숫자로 사용될 때 개체가 없음을 의미합니다.”-Wolfram MathWorld http://mathworld.wolfram.com/Zero.html

자유롭게 선택하지만 0은 본질적으로 아무것도 의미하지 않으며 거기에 존재하지 않습니다. 따라서 상대 오차를 계산할 때 게이지 압력을 사용하는 것이 이치에 맞지 않습니다. 는 유용하지만 대기압에는 아무 것도 없다고 가정합니다. 절대 압력이 1 기압이기 때문에 우리는 이것이 사실이 아니라는 것을 알고 있습니다. 따라서 아무것도에 대한 상대 오차는 존재하지 않고 정의되지 않습니다. .

이에 대해 자유롭게 이의를 제기하십시오. 간단히 말해서 하단 값에 값을 추가하는 것과 같은 빠른 수정은 결함이 있으며 정확하지 않습니다. 단순히 오류를 최소화하려는 경우에도 여전히 유용 할 수 있습니다. 하지만 불확실성을 정확하게 측정하려고한다면 그렇게 많지는 않습니다 …

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다