Eu tenho dois instrumentos de medida diferentes, A e B, ambos medem a mesma quantidade física, mas com unidades de medida diferentes: $ u_A $ e $ u_B $.

A é um instrumento de referência.

Eu medi uma parte de referência $ L $ $ n $ vezes com A e obtenho os $ n $ valores $ L_ { Ai} $ ($ i = 1 \ dots n $) expresso em termos da unidade de medida $ u_A $.

Então, eu meço a mesma parte de referência, $ L $, $ m $ vezes com B e obtenho os valores $ m $ $ L_ {Bj} $ ($ j = 1 \ dots m $) expressos em termos da unidade de medida $ u_B $.

No futuro, farei meu medidas com B, mas estarei interessado na medida expressa em termos da unidade de medida $ u_A $.

Presumo que posso converter $ u_B $ em $ u_A $ por meio de apenas um fator de conversão multiplicativo $ k $.

Agora, eu tenho três perguntas:

  1. É possível avaliar a validade da suposição acima a partir dos valores $ L_ {Ai } $ e $ L_ {Bj} $?

  2. Se a suposição for válida, como posso calcular o fator de conversão $ k $ para converter a medida de $ u_B $ para $ u_A $, ou seja, $ L_A = k L_B $?

  3. Como gerenciar o caso em que tenho mais de uma parte, ou seja, $ L_1 $, $ L_2 $, etc.

Minha primeira tentativa é assumir a suposição é válida e então calcule $ k $ como $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $ mas é mais baseado em ” bom senso “em vez de uma base estatística adequada.

Você pode me dar algumas dicas sobre a parte das estatísticas que cobre esse tipo de problema? Talvez a regressão linear?

Comentários

  • Seu método (procurando por ” um fator de conversão multiplicativo “) não funcionaria entre Fahrenheit e Celsius.
  • @Henry Sim, eu sei, é por esse motivo que fiz a pergunta número 1.
  • Você está nos dizendo que sabe que a mesma quantidade física é medida em unidades diferentes, mas não sabe como as unidades são convertidas?
  • @cbeleites Sim.
  • Mas você conhece as unidades?

Resposta

Com base em seus comentários, o que você deseja fazer é um calibração , que você também deseja validar :

você tem

  • medições de referência de uma temperatura ( termômetro A) e
  • medições de instrumento B que ainda não é um termômetro, pois você não obtém resposta das temperaturas de quantidade física, mas de uma quantidade física como e. elétrons / s.
    A leitura da câmera não é a mesma quantidade física que a temperatura.

Então, na verdade, sua tarefa é encontrar a conversão entre elétrons / se temperatura, ou seja, para calibre a saída da câmera de acordo com as temperaturas.

Sou quimiometrista, faço calibrações para relacionar a leitura do instrumento com as quantidades químicas. Existem livros inteiros escritos sobre o assunto de como obter um bom modelo de calibração (sua pergunta 2 ) e, em seguida, como validar esse método (sua pergunta 1).

Então:

Pergunta 1: como calcular o parâmetro $ k $ ?

Isso é chamado de ajuste do modelo de calibração.

E esta parte realmente começa com a decisão de que tipo de modelo é apropriado. Esta é a sua suposição (multiplicativa) é.

Na quimiometria, às vezes os termos modelos soft e hard são usados para distinguir:

  • modelos hard: derivando o ansatz para o modelo dos primeiros princípios (globais) ,
    por exemplo, descrevendo g leitura da câmera em função da temperatura (por exemplo radiação de corpo negro, eficiência quântica da câmera em diferentes comprimentos de onda, …) e, em seguida, resolvendo a temperatura e simplificando o máximo possível, combinando tantos parâmetros quanto possível em menos parâmetros que precisam ser determinados experimentalmente.
  • modelos soft: modelando a função de calibração por aproximações que são independentes da conexão física exata.
    Ex. você pode assumir que, se sua faixa de temperatura for estreita o suficiente, você pode aproximar o ansatz rígido desconhecido por um modelo linear. Se isso não for suficiente, quadrático pode ser apropriado etc. Ou, você pode esperar um comportamento sigmóide etc.

Recomendação 1: pense um pouco e decida aproximadamente que tipo de relacionamento você espera.

A modelagem suave é uma opção válida e amplamente usada, mas você deve ser capaz de dar raciocinar por que a relação multiplicativa é sensata em comparação com outras famílias de funções como sigmóide, exponencial ou logarítmica.

Pergunta 3: O que fazer com mais $ L $ s?

Não tenho certeza se entendi corretamente quais são os diferentes $ L $ s.

  • se forem medidas de peças com outra temperatura, você vai precisar delas como Peter Flom e Gung já disseram.
    Normalmente, extrapolar fora do intervalo calibrado (ou seja, o intervalo de temperatura medido pelos dados de ajuste do seu modelo) não é considerado válido . Você pode argumentar a favor de uma exceção se validar (veja abaixo) o método para um intervalo mais amplo; mas se você pode obter uma ampla gama de dados de validação, não há motivo para não conseguir dados de treinamento para essa gama também.

  • se você se referir à câmera tendo muitos pixels: dependerá das propriedades da câmera se você pode razoavelmente assumir que todos os pixels seguem a mesma calibração ou se você precisa calibrar cada pixel.

Pergunta 1: Como saber se a relação multiplicativa é apropriada? Parte I

Na quimiometria, multiplicativa sem interceptação nem mesmo é feita em situações onde o modelo rígido sugere relação apenas multiplicativa (por exemplo, Beer-Lambert-law) como geralmente há muitas coisas na construção de instrumentos que levam a uma interceptação.
Minha experiência sugere que a relação multiplicativa sem um termo de interceptação dificilmente é apropriada para a leitura da câmera.
Por exemplo, leitura de todas as câmeras I ” com o qual trabalhei até agora havia um viés ou uma corrente escura que seria uma interceptação no modelo.

Recomendação 2: se você decidir por um modelo multiplicativo sem interceptar, você deve ser capaz de dar muito boas razões pelas quais nenhuma interceptação pode ocorrer. Isso pode ser mais fácil ao contrário: tente inventar situações que levariam a uma interceptação para a leitura da câmera. Se você puder encontrar uma interceptação, deve incluir uma no modelo.

O chamado diagnóstico de regressão para modelos lineares dirá se a interceptação não pode ser distinguida de zero . Isso seria uma evidência que permite ajustar um modelo sem interceptar. Da mesma forma, você pode ajustar um modelo quadrático e ver se o termo quadrático pode ser diferenciado de zero.

Questão 1: Como saber se a relação multiplicativa é apropriada? Parte II

Embora você possa identificar certas coisas que estão dando errado dentro do conjunto de medições usado para construir o modelo de calibração, ” válido ” significa mais do que isso. Normalmente, significa demonstrar que sua calibração pode ser aplicada com sucesso à leitura da câmera de amostras completamente desconhecidas (possivelmente medidas algum tempo após a calibração). Novamente, há todo um corpo de literatura para validação e, dependendo de qual é o seu campo exato, também existem normas que você deve seguir.

Resumidamente, para validação, você precisa de um segundo conjunto de medições que não estava envolvido de nenhuma forma na construção da calibração. Em seguida, você compara a saída do instrumento de referência com as previsões da calibração. Olhando para os desvios, você pode avaliar vários aspectos da correção de sua calibração:

  • viés (ou seja, seu modelo tem uma tendência sistemática desvio)
  • variância (incerteza aleatória)
  • deriva (ou seja, $ k $ mudanças ao longo do tempo; requer planejamento apropriado de medições )

Alguma literatura

Comentários

  • Muito obrigado. Você tem alguma sugestão para um bom tutorial ou livro online?
  • @uvts_cvs: Eu adicionei alguns links para literatura. Os 2 últimos são jornais que podem estar atrás de uma barreira para você. Além disso, posso recomendar alguns livros em alemão.

Resposta

Se você fizer a suposição menos restritiva de que as duas medições estão relacionadas por alguma equação linear, então : Para a pergunta 1, você pode avaliar a suposição usando regressão linear. Se for válido, a interceptação deve ser 0 (ou muito próxima de 0, se houver erro de medição).

Para a pergunta 2, o coeficiente indicará a constante a ser usada

Não tenho certeza sobre a pergunta 3, mas fazer várias regressões múltiplas deve dar resultados muito semelhantes, a menos que haja muitos erros de medição.

Por exemplo, para Fahrenheit e Celsius:

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

e, com esta semente pelo menos, os resultados são bastante próximos.

Dado que você terá mais de três medições com cada instrumento, você pode avaliar a suposição inicial desenhando um gráfico de dispersão das duas medições e, em seguida, usando uma curva suave, como loess ou splines. Se a suposição estiver correta, a curva suave será quase reta.

Comentários

  • Obrigado. Seu exemplo de código é significativo porque você usa três valores diferentes para LAbase, meu caso é mais parecido com LAbase <- c(10, 10, 10) onde L=10 e n=3 e, nesse caso, o modelo calculado m1 não é significativo para mim.
  • Se você obtiver os mesmos valores o tempo todo para LAbase, não há como fazer nada.

Resposta

  1. Sua suposição de que as medidas serão diferentes apenas por uma constante multiplicativa me parece certamente falsa. O fato de que isso não funcionaria para a conversão de Fahrenheit para Celsius demonstra isso.
  2. (A.k.a. # 3) Você precisará avaliar mais de uma parte. Você não terá graus de liberdade suficientes para determinar a conversão entre as duas medições se usar apenas uma parte. Além disso, tente obter partes em que os verdadeiros valores das medições abrangem uma faixa tão grande quanto possível e, certamente, abrangem a faixa dentro da qual você desejará fazer a conversão no futuro.
  3. (A.k.a. # 2) Você pode determinar a equação de conversão por meio de uma análise de regressão. Com várias medidas, você poderia usar um modelo de vários níveis, mas suspeito que isso seja mais do que o necessário. Se você fizer várias medidas de cada parte com cada instrumento de medição, pode apenas usar as médias, conforme descreve, para obter uma medida mais robusta. Então, você pode apenas usar esses dois meios como seus valores $ x $ e $ y $ para essa parte. As estimativas beta da equação de regressão darão a você a mudança necessária.

    Observe que esses não serão os mesmos valores que você poderia obter por meio de outras estratégias de conversão, no entanto, porque o procedimento é diferente; por exemplo, para converter de Fahrenheit para Celsius, você pode subtrair 32 e dividir por 1,8 , mas para usar uma equação de regressão, $ \ beta_0 \ approx18 $ e $ \ beta_1 \ approx.6 $. Isso não importa, contanto que você saiba qual procedimento está usando.

    Outro A vantagem da abordagem de regressão, aliás, é que a conversão entre dois instrumentos de medição não será necessariamente linear em toda a faixa possível, que uma análise de regressão pode permitir modelar.

Resposta

Se você tiver várias medidas do mesmo quantidade várias vezes nas duas unidades, em geral, não há como estimar a transformação de uma unidade para a outra.

No entanto, se você sabia que existe uma relação multiplicativa entre os dois, e que o ruído nos dois conjuntos se as medições são zero- média normal (com variâncias iguais ou variâncias diferentes, mas conhecidas), então você pode estimar o fator multiplicativo $ k $ por máxima verossimilhança.

Se você fizer as suposições acima, poderá proceder da seguinte forma. Seja $ X_B $ o valor real da quantidade medida repetidamente em unidades de $ B $. Então $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ pontos, n $, e $ L_ {Bj} = X_B + f_j $, $ j = 1, \ pontos, m $.

$ e_i $ e $ f_j $ são i.i.d. normais, variáveis aleatórias normais com média 0 e variância $ \ sigma ^ 2 $. Você pode escrever o log da probabilidade dos dados como

$$ L (dados; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$

Você deve ser capaz de maximizar esta quantidade em termos de $ k $ e $ X_B $ para obter sua transformação (e uma estimativa da quantidade).

Na verdade, se você passar pela álgebra de definir as derivadas parciais da função log-verossimilhança com relação a $ k $ e $ X_B $ a zero, você deve obter a expressão para $ k $ que você tem em sua pergunta.

$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ e $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

Resposta

O documento-chave de que você precisa é o GUM (Guia para a Incerteza na Medição) – JCGM 100: 2008 (GUM 1995 com pequenas correções) Bureau International de Poids et Medidas / guias / goma que fornece todos os detalhes (padrão internacional) sobre como avaliar o desempenho de uma medida em relação a um referência (sua referência já terá uma incerteza avaliável). Os documentos do US NIST são baseados diretamente nisso também.

O GUM permite que você faça sua escolha sobre o método de avaliação, mas exige que você forneça um termo de erro para quaisquer suposições, como a crença de que os dois instrumentos não têm compensação.

Você terá termos sistemáticos e termos aleatórios. Os termos sistemáticos são geralmente os de maior erro e são comumente subestimados (observe as primeiras estimativas de 1900 para a velocidade da luz e suas barras de erro – que não se sobrepõem!).

Porque você tenha apenas uma parte de referência, tudo o que você pode fazer, até agora, é avaliar os tamanhos relativos dos dois erros aleatórios de medição (incluindo variação sistemática local, como temperatura, operador, hora do dia ..)

No final, você seria capaz de declarar um erro e um fator de cobertura para suas novas leituras em algum intervalo de validade.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *