Como calculo o erro relativo quando o valor verdadeiro é zero?

Digamos que tenho $ x_ {true} = 0 $ e $ x_ {teste} $. Se eu definir erro relativo como:

$ \ text {erro relativo} = \ frac {x_ {true} -x_ {test}} {x_ {true}} $

Então o erro relativo é sempre indefinido. Se, em vez disso, eu usar a definição:

$ \ text {erro relativo} = \ frac {x_ {true} -x_ {teste}} {x_ {teste}} $

Então o erro relativo é sempre 100%. Ambos os métodos parecem inúteis. Existe outra alternativa?

Comentários

  • Eu tive exatamente a mesma pergunta com relação ao viés de parâmetro em simulações de Monte Carlo, usando sua primeira definição. Um dos meus valores de parâmetro era 0, então não ‘ calculei o viés do parâmetro para este parâmetro específico …
  • A solução é não usar o erro relativo neste caso.

Resposta

Existem muitas alternativas , dependendo da finalidade.


Um comum é a “diferença percentual relativa” ou RPD, usada em procedimentos de controle de qualidade de laboratório. Embora você possa encontrar muitas fórmulas aparentemente diferentes, todas elas se resumem a comparar a diferença de dois valores com sua magnitude média:

$$ d_1 (x, y) = \ frac {x – y} {( | x | + | y |) / 2} = 2 \ frac {x – y} {| x | + | y |}. $$

Esta é uma expressão assinada , positiva quando $ x $ excede $ y $ e negativa quando $ y $ excede $ x $. Seu valor sempre fica entre $ -2 $ e $ 2 $. Ao usar valores absolutos no denominador, ele trata os números negativos de uma maneira razoável. A maioria das referências que posso encontrar, como a Orientação técnica sobre avaliação de qualidade de dados e avaliação de usabilidade de dados do programa de correção de sites DEP de Nova Jersey de Nova Jersey , usa o valor absoluto de $ d_1 $ porque eles estão interessados apenas na magnitude do erro relativo.


Um artigo da Wikipedia sobre Mudança e diferença relativa observa que

$$ d_ \ infty (x, y) = \ frac {| x – y |} {\ max (| x |, | y |)} $$

é freqüentemente usado como um teste de tolerância relativa em algoritmos numéricos de ponto flutuante. O mesmo artigo também aponta que fórmulas como $ d_1 $ e $ d_ \ infty $ podem ser generalizadas para

$$ d_f (x, y) = \ frac {x – y} {f (x, y)} $$

onde a função $ f $ depende diretamente das magnitudes de $ x $ e $ y $ (geralmente assumindo que $ x $ e $ y $ são positivos). Como exemplos, ele oferece suas médias máximas, mínimas e aritméticas (com e sem tomar os valores absolutos de $ x $ e $ y $), mas pode-se contemplar outros tipos de médias, como a média geométrica $ \ sqrt {| xy |} $, a média harmônica $ 2 / (1 / | x | + 1 / | y |) $ e $ L ^ p $ significa $ ((| x | ^ p + | y | ^ p) / 2) ^ { 1 / p} $. ($ d_1 $ corresponde a $ p = 1 $ e $ d_ \ infty $ corresponde ao limite de $ p \ a \ infty $.) Pode-se escolher um $ f $ com base no comportamento estatístico esperado de $ x $ e $ y $. Por exemplo, com distribuições aproximadamente log-normais, a média geométrica seria uma escolha atraente para $ f $ porque é uma média significativa nessa circunstância.


A maioria dessas fórmulas apresenta dificuldades quando o denominador é igual zero. Em muitas aplicações, isso não é possível ou é inofensivo definir a diferença para zero quando $ x = y = 0 $.

Observe que todas essas definições compartilham uma invariância fundamental propriedade: qualquer que seja a função de diferença relativa $ d $, ela não muda quando os argumentos são redimensionados uniformemente por $ \ lambda \ gt 0 $:

$$ d (x, y) = d ( \ lambda x, \ lambda y). $$

É esta propriedade que nos permite considerar $ d $ uma diferença relativa . Assim, em particular, uma função não invariável como

$$ d (x, y) =? \ \ Frac {| xy |} {1 + | y |} $$

simplesmente não se qualifica. Quaisquer que sejam as virtudes que possa ter, não expressa uma diferença relativa.


A história não termina aqui. Podemos até achar proveitoso levar as implicações da invariância um pouco mais longe.

O conjunto de todos os pares ordenados de números reais $ (x, y) \ ne (0,0) $ onde $ (x, y) $ é considerado o mesmo que $ (\ lambda x, \ lambda y) $ é o Linha Projetiva Real $ \ mathbb {RP} ^ 1 $. Tanto no sentido topológico quanto no algébrico, $ \ mathbb {RP} ^ 1 $ é um círculo. Qualquer $ (x, y) \ ne (0,0) $ determina uma linha única através da origem $ (0,0) $. Quando $ x \ ne 0 $ sua inclinação é $ y / x $; caso contrário, podemos considerar sua inclinação como “infinita” (e negativa ou positiva). Uma vizinhança desta linha vertical consiste em linhas com declives positivos extremamente grandes ou negativos extremamente grandes. Podemos parametrizar todas essas linhas em termos de seu ângulo $ \ theta = \ arctan (y / x) $, com $ – \ pi / 2 \ lt \ theta \ le \ pi / 2 $.Associado a cada $ \ theta $ está um ponto no círculo,

$$ (\ xi, \ eta) = (\ cos (2 \ theta), \ sin (2 \ theta)) = \ left (\ frac {x ^ 2-y ^ 2} {x ^ 2 + y ^ 2}, \ frac {2xy} {x ^ 2 + y ^ 2} \ right). $$

Qualquer distância definida no círculo pode, portanto, ser usada para definir uma diferença relativa.

Como um exemplo de onde isso pode levar, considere a distância usual (euclidiana) no círculo, em que a distância entre dois pontos é o tamanho do ângulo entre eles. A diferença relativa é menor quando $ x = y $, correspondendo a $ 2 \ theta = \ pi / 2 $ (ou $ 2 \ theta = -3 \ pi / 2 $ quando $ x $ e $ y $ têm sinais opostos). Deste ponto de vista, uma diferença relativa natural para números positivos $ x $ e $ y $ seria a distância a este ângulo:

$$ d_S (x, y) = \ left | 2 \ arctan \ left (\ frac {y} {x} \ right) – \ pi / 2 \ right |. $$

Para a primeira ordem, esta é a distância relativa $ | xy | / | y | $ – -mas funciona mesmo quando $ y = 0 $. Além disso, ele não explode, mas em vez disso (como uma distância sinalizada) é limitado entre $ – \ pi / 2 $ e $ \ pi / 2 $, como este gráfico indica:

Figura

Isso indica quão flexíveis são as escolhas ao selecionar uma forma de medir as diferenças relativas.

Comentários

  • Obrigado pela resposta abrangente, qual você acha que é a melhor referência para esta linha: ” é frequentemente usado como um teste de tolerância relativa em algoritmos numéricos de ponto flutuante. O mesmo artigo também destaca que fórmulas como d1d1 e d∞d∞ podem ser generalizadas para ”
  • @Hammad Você seguiu o link para o artigo da Wikipedia?
  • Sim! Eu dei uma olhada na Wikipedia; acho que ‘ s não é uma referência real (essa linha também não tem nenhuma referência no wiki)
  • btw, deixa pra lá, eu encontrei uma referência acadêmica para isso 🙂 tandfonline.com/doi/abs/10.1080/00031305.1985.10479385
  • @KutalmisB Obrigado por notar que: o ” min ” não ‘ não pertence a esse lugar. Parece que pode ter sido um vestígio de uma fórmula mais complexa que manipulou todos os sinais possíveis de $ x $ e $ y $ que posteriormente simplifiquei. Eu o removi.

Resposta

Primeiro, observe que você normalmente pega o valor absoluto ao calcular o relativo erro.

Uma solução comum para o problema é calcular

$$ \ text {erro relativo} = \ frac {\ left | x _ {\ text {true}} – x _ {\ text {test}} \ right |} {1+ \ left | x _ {\ text {true}} \ right |}. $$

Comentários

  • Isso é problemático porque varia dependendo das unidades de medida escolhidas para os valores.
  • Isso ‘ é absolutamente verdadeiro. Esta não é ‘ uma solução perfeita para o problema, mas é uma abordagem comum que funciona razoavelmente bem quando $ x $ é bem dimensionado.
  • Você poderia explicar melhor sua resposta sobre o que você quer dizer com ” bem dimensionado “? Por exemplo, suponha que os dados surjam da calibração de um sistema de medição de química aquosa projetado para concentrações entre $ 0 $ e $ 0,000001 $ moles / litro, que pode atingir uma precisão de, digamos, três dígitos significativos. Seu ” erro relativo ” seria, portanto, constantemente zero, exceto para medições obviamente erradas. Diante disso, como exatamente você redimensionaria esses dados?
  • Seu exemplo é aquele em que a variável não é ‘ t bem dimensionada. Por ” bem dimensionado “, quero dizer que essa variável é dimensionada de forma que assuma valores em um pequeno intervalo (de, por exemplo, um par de ordens de magnitude) perto de 1. Se sua variável assume valores acima de muitas ordens de magnitude, então você ‘ tem problemas de escala mais sérios e esta abordagem simples não ‘ não será adequado.
  • Alguma referência para essa abordagem? O nome deste método? Obrigado.

Resposta

Fórmula MAPE

Finding MAPE,

É um tópico muito discutível e muitos contribuidores de código aberto discutiram o tópico acima. A abordagem mais eficiente até agora é seguida pelos desenvolvedores. Consulte este PR para saber mais.

Resposta

Fiquei um pouco confuso sobre isso por um tempo. No final, é porque se você está tentando medir o erro relativo em relação a zero, então você está tentando forçar algo que simplesmente não existe.

Se você pensar sobre isso, você está comparando maçãs com laranjas quando compara o erro relativo ao erro medido de zero, porque o erro medido de zero é equivalente ao valor medido (é por isso que você obtém 100% de erro ao dividir pelo número de teste).

Por exemplo, considere medir o erro da pressão manométrica (a pressão relativa da atmosférica) versus a pressão absoluta. Digamos que você use um instrumento para medir a pressão manométrica em condições atmosféricas perfeitas, e seu dispositivo mediu a pressão atmosférica no local de forma que registrasse 0% de erro. Usando a equação que você forneceu e primeiro assumindo que usamos a pressão manométrica medida, para calcular o erro relativo: $$ \ text {erro relativo} = \ frac {P_ {medidor, verdadeiro} – P_ {gauge, test}} {P_ {gauge, true}} $$ Então $ P_ {gauge, true} = 0 $ e $ P_ {gauge, test} = 0 $ e você não obtém 0% de erro, em vez disso, é indefinido. Isso ocorre porque o erro percentual real deve estar usando os valores de pressão absoluta como este: $$ \ text {erro relativo} = \ frac {P_ {absoluto, verdadeiro} -P_ {absoluto, test}} {P_ {absolute, true}} $$ Agora $ P_ {absolute, true} = 1atm $ e $ P_ {absolute, test} = 1atm $ e você obtém 0% de erro. Esta é a aplicação adequada do erro relativo. O aplicativo original que usava pressão manométrica era mais parecido com “erro relativo do valor relativo”, que é diferente de “erro relativo”. Você precisa converter a pressão manométrica em absoluta antes de medir o erro relativo.

A solução para sua pergunta é certificar-se de que está lidando com valores absolutos ao medir o erro relativo, de forma que zero não seja uma possibilidade. Então, você está realmente obtendo um erro relativo e pode usar isso como uma incerteza ou uma métrica de seu erro percentual real. Se você deve ficar com os valores relativos, então você deve usar o erro absoluto, porque o erro relativo (porcentagem) mudará dependendo do seu ponto de referência.

É difícil colocar uma definição concreta em 0. .. “Zero é o número inteiro denotado 0 que, quando usado como um número de contagem, significa que nenhum objeto está presente.” – Wolfram MathWorld http://mathworld.wolfram.com/Zero.html

Sinta-se à vontade para escolher nitidamente, mas zero essencialmente não significa nada, não está lá. É por isso que não faz sentido usar a pressão manométrica ao calcular o erro relativo. Pressão manométrica , embora útil, assume que não há nada na pressão atmosférica. Sabemos que não é o caso, pois tem uma pressão absoluta de 1 atm. Assim, o erro relativo em relação a nada, simplesmente não existe, é indefinido .

Sinta-se à vontade para argumentar contra isso, basta colocar: quaisquer soluções rápidas, como adicionar um ao valor inferior, são falhas e não são precisas. Eles ainda podem ser úteis se você estiver simplesmente tentando minimizar o erro. Porém, se você está tentando fazer medições precisas de incerteza, nem tanto …

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *