두 개의 다른 측정 도구 A와 B가 있는데 둘 다 동일한 물리량을 측정하지만 측정 단위는 다릅니다. $ u_A $ 및 $ u_B $.

A는 참조 도구입니다.

A로 참조 부품을 $ L $ $ n $ 번 측정하고 $ n $ 값을 얻습니다. $ L_ { Ai} $ ($ i = 1 \ dots n $)는 측정 단위 $ u_A $로 표현됩니다.

그런 다음 B로 동일한 기준 부품 $ L $, $ m $를 측정합니다. 측정 단위 $ u_B $로 표현 된 $ m $ 값 $ L_ {Bj} $ ($ j = 1 \ dots m $)를 얻습니다.

향후 B로 측정하지만 측정 단위 $ u_A $로 표현되는 측정 값에 관심이 있습니다.

단지 하나의 곱셈 변환 계수를 사용하여 $ u_B $를 $ u_A $로 변환 할 수 있다고 가정합니다. $ k $.

이제 세 가지 질문이 있습니다.

  1. $ L_ {Ai 값에서 시작하여 위 가정의 유효성을 평가할 수 있습니까? } $ 및 $ L_ {Bj} $?

  2. 가정이 타당하다면 변환 계수 $ k $를 계산하여 측정 값을 $ u_B $에서 $ u_A $ (예 : $ L_A = k L_B $)로 변환하려면 어떻게해야합니까?

  3. 하나 이상의 파트 (예 : $ L_1 $, $ L_2 $ 등)를 관리하는 방법

첫 번째 시도는 가정이 유효하다고 가정하고 $ k $를 $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $로 계산하지만 ” 적절한 통계적 근거보다는 상식적입니다.

이러한 종류의 문제를 다루는 통계 부분에 대한 힌트를 주실 수 있습니까? 선형 회귀일까요?

댓글

  • 방법 (” 하나의 곱셈 변환 계수 “)는 화씨와 섭씨 사이에서 작동하지 않습니다.
  • @Henry 예, 알아요. 그 이유 때문에 1 번 질문을했습니다.
  • 동일한 물리적 수량이 다른 단위로 측정된다는 것을 알고 있지만 단위가 어떻게 변환되는지는 모릅니다
  • @cbeleites 예.
  • 하지만 당신은 단위를 알고 계십니까?

답변

귀하의 의견에 따라 수행하려는 작업은

보정 , 검증 :

  • 온도 ( 온도계 A)의 기준 측정 값 및
  • 기기 B는 아직 온도계가 아닙니다. 응답을받지 못합니다. 물리량의 온도이지만 예를 들어 물리량의 전자 / 초.
    카메라 판독 값은 온도와 동일한 물리량이 아닙니다.

사실 당신의 임무는 전자 / 초와 온도 사이의 변환을 찾는 것입니다. 카메라 출력을 온도로 보정합니다.

저는 화학 측정 학자입니다. 계측기 판독 값을 화학적 양과 관련시키기 위해 보정을 수행합니다. 좋은 보정 모델을 얻는 방법에 대한 전체 책이 있습니다 (질문 2 ) 및이 방법의 유효성을 검사하는 방법 (질문 1).

그래서 :

질문 1 : 매개 변수 계산 방법 $ k $ ?

이것을 보정 모델 피팅이라고합니다.

그리고이 부분은 실제로 어떤 종류의 모델이 적합한 지 결정하는 것으로 시작합니다. 이것이 여러분의 가정입니다 (곱셈).

화학 측정에서 때때로 소프트 모델과 하드 모델이라는 용어가 다음을 구분하는 데 사용됩니다.

  • 하드 모델 : 첫 번째 (글로벌) 원칙에서 모델에 대한 ansatz 유도 ,
    예 : 설명 g 온도에 따른 카메라 판독 값 (예 : 흑체 복사, 서로 다른 파장에서 카메라의 양자 효율 등) 온도를 계산하고 가능한 한 많은 매개 변수를 실험적으로 결정해야하는 적은 수의 매개 변수로 병합하여 최대한 단순화합니다.
  • 소프트 모델 : 정확한 물리적 연결과 무관 한 근사치로 보정 기능을 모델링합니다.
    예 온도 범위가 충분히 좁 으면 선형 모델로 알려지지 않은 하드 ansatz를 근사 할 수 있다고 가정 할 수 있습니다. 충분하지 않은 경우 2 차가 적절할 수 있습니다. 또는 시그 모이 드 동작 등을 기대할 수 있습니다.

권장 사항 1 : 약간의 생각을하고 예상되는 관계 유형을 대략적으로 결정합니다.

소프트 모델링은 유효하고 널리 사용되는 옵션이지만 제공 할 수 있어야합니다. 시그 모이 드, 지수 또는 로그와 같은 다른 함수 군에 비해 곱셈 관계가 합리적인 이유를 추론합니다.

질문 3 : $ L $ s?

다른 $ L $ 이 무엇인지 올바르게 이해하고 있는지 잘 모르겠습니다.

  • 다른 온도로 부품을 측정하는 경우 Peter Flom과 gung이 이미 말했듯이 필요합니다.
    보통 보정 된 범위를 벗어난 외삽 (즉, 모델 피팅 데이터에 포함 된 온도 범위) 는 유효한 것으로 간주되지 않습니다. . 더 넓은 범위에 대해 방법을 검증 (아래 참조)하면 예외를 주장 할 수 있습니다. 하지만 광범위한 검증 데이터를 얻을 수 있다면 해당 범위에 대한 훈련 데이터도 얻을 수없는 이유가 없습니다.

  • 카메라를 참조하면 많은 픽셀이있는 경우 : 모든 픽셀이 동일한 보정을 따른다고 합리적으로 가정 할 수 있는지 또는 각 픽셀을 보정해야하는지 여부는 카메라의 속성에 따라 다릅니다.

질문 1 : 곱셈 관계가 적절한 지 아는 방법 파트 I

화학계에서는 하드 모델이 곱셈 전용 관계 (예 : Beer-Lambert-law)를 다음과 같이 제안하는 상황에서도 절편없는 곱셈이 수행되지 않습니다. 일반적으로 도구의 구성에는 절편으로 이어지는 많은 것들이 있습니다.
제 경험에 따르면 절편 기간이없는 곱셈 관계는 카메라 판독에 적합하지 않습니다.
예 : 모든 카메라 판독 I ” 지금까지 작업 한 사람은 바이어스 또는 암전류가 있었기 때문에 모델에서 절편이 될 것입니다.

권장 사항 2 : 절편없는 곱셈 모델을 결정하면 매우 인터셉트가 발생하지 않는 이유. 다른 방법으로는 더 쉬울 수 있습니다. 카메라 판독 값을 가로채는 상황을 고안해보십시오. 절편을 생각 해낼 수 있다면 모델에 하나를 포함해야합니다.

선형 모델에 대한 소위 회귀 진단 은 절편이 0과 구별 될 수 없는지 여부를 알려줍니다. . 그것은 절편없이 모델을 맞출 수있는 증거가 될 것입니다. 마찬가지로 2 차 모델을 피팅하고 2 차 항이 0과 구별 될 수 있는지 확인할 수 있습니다.

질문 1 : 곱셈 관계가 적절한 지 어떻게 알 수 있습니까? 파트 II

교정 모델을 구축하는 데 사용 된 측정 세트 내에서 잘못된 특정 사항을 발견 할 수 있지만 ” 유효 “는 그 이상을 의미합니다. 일반적으로 완전히 알려지지 않은 샘플의 카메라 판독 값에 보정을 성공적으로 적용 할 수 있음을 보여줍니다 (보정이 완료된 후 얼마 동안 측정되었을 수 있음). 다시 한 번 검증 에 대한 문헌 전체가 있으며 정확한 필드가 무엇인지에 따라 다음과 같은 규범도 있습니다.

간단히, 유효성 검사를 위해서는 보정을 구축하는 데 전혀 관여하지 않은 두 번째 측정 세트가 필요합니다. 그런 다음 기준 기기의 출력을 보정 예측과 비교합니다. 편차를 살펴보면 보정의 정확성에 대한 여러 측면을 평가할 수 있습니다.

  • 편향 (즉, 모델에 체계적인 편차)
  • 분산 (무작위 불확실성)
  • 드리프트 (예 : 시간에 따른 $ k $ 변화, 적절한 측정 계획 필요) )

일부 문헌

댓글

  • 감사합니다. 좋은 온라인 튜토리얼이나 책에 대한 제안이 있습니까?
  • @uvts_cvs : 문헌에 대한 링크를 추가했습니다. 후자의 2는 당신을 위해 지불 벽 뒤에있을 수있는 저널 논문입니다. 그 외에도 독일어로 된 책을 추천 해 드릴 수 있습니다.

답변

두 측정 값이 일부 선형 방정식과 관련이 있다는 덜 제한적인 가정을한다면 : 질문 1의 경우 선형 회귀를 사용하여 가정을 평가할 수 있습니다. 유효하다면 절편은 0이어야합니다 (또는 측정 오류가있는 경우 0에 매우 가까움).

질문 2의 경우 계수는 사용할 상수를 알려줍니다.

질문 3에 대해 잘 모르겠지만 여러 번의 회귀를 수행하면 측정 오류가 많지 않는 한 매우 유사한 결과를 얻을 수 있습니다.

예 : 화씨 및 섭씨 :

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

최소한이 시드를 사용하면 결과가 매우 비슷합니다.

각 기기로 세 개 이상의 측정을 수행하는 경우 두 측정의 산점도를 그린 다음 황토 또는 스플라인과 같은 부드러운 곡선을 사용하여 초기 가정을 평가할 수 있습니다. 가정이 맞으면 부드러운 곡선이 거의 직선이됩니다.

댓글

  • 감사합니다. 귀하의 코드 샘플은 LAbase에 대해 세 가지 값을 사용하기 때문에 의미가 있습니다. 제 경우는 iv id = “6773cca412″인 LAbase <- c(10, 10, 10)와 비슷합니다. >

n=3그리고이 경우 계산 된 모델m1는 나에게 의미가 없습니다.

  • LAbase에 대해 항상 동일한 값을 얻는다면 아무것도 할 방법이 없습니다.
  • Answer

    1. 측정 값이 곱셈 상수에 의해서만 달라진다는 당신의 가정은 저를 확실히 잘못된 것입니다. 이것이 화씨에서 섭씨로 변환하는 데 작동하지 않는다는 사실은이를 증명합니다.
    2. (A.k.a. # 3) 두 개 이상의 부분을 평가해야합니다. 한 부품 만 사용하는 경우 두 측정 간의 변환을 결정할 수있는 자유도가 충분하지 않습니다. 또한 측정 값의 실제 값이 가능한 한 넓은 범위에 걸쳐 있고 향후 변환을 수행하려는 범위에 해당하는 부분을 얻으십시오.
    3. (일명 # 2) 회귀 분석을 통해 변환 방정식을 결정할 수 있습니다. 여러 측정 값을 사용하면 다단계 모델을 사용할 수 있지만 이것이 필요한 것 이상이라고 생각합니다. 각 측정 기기로 각 부품에 대해 여러 측정을 수행하는 경우 설명하는대로 평균을 사용하여보다 강력한 측정을 얻을 수 있습니다. 그런 다음이 두 가지 수단을 해당 부분에 대한 $ x $ 및 $ y $ 값으로 사용할 수 있습니다. 회귀 방정식의 베타 추정치는 필요한 이동을 제공합니다.

      이 값은 다른 변환 전략을 통해 얻을 수있는 값과 같지 않지만 절차가 다르기 때문에 예를 들어 화씨에서 섭씨로 변환하려면 32를 빼고 1.8로 나눌 수 있습니다. 하지만 회귀 방정식을 사용하려면 $ \ beta_0 \ approx18 $ 및 $ \ beta_1 \ approx.6 $를 사용합니다. 어떤 절차를 사용 중인지 알고있는 한 이것은 중요하지 않습니다.

      다른 그런데 회귀 접근 방식의 장점은 두 측정 도구 간의 변환이 가능한 범위 전체에서 반드시 선형 일 필요는 없다는 것입니다. 회귀 분석을 통해 모델링 할 수 있습니다.

    답변

    동일한 측정 값이 여러 개인 경우 양을 두 단위로 여러 번 반복하면 일반적으로 한 단위에서 다른 단위로의 변환을 추정 할 방법이 없습니다.

    그러나 둘 사이에 곱셈 관계가 있다는 것을 알고 , 측정 값이 0 인 경우 두 세트의 잡음이 그리고 평균 정규 (균등 분산 또는 다르지만 알려진 분산)를 사용하면 최대 가능성으로 곱셈 요소 $ k $를 추정 할 수 있습니다.

    위의 가정을 수행하면 다음과 같이 진행할 수 있습니다. $ X_B $를 $ B $ 단위로 반복적으로 측정하는 수량의 실제 값이라고합시다. 그러면 $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ dots, n $ 및 $ L_ {Bj} = X_B + f_j $, $ j = 1, \ dots, m $.

    $ e_i $ 및 $ f_j $는 평균이 0이고 분산이 $ \ sigma ^ 2 $ 인 정규 i.i.d. 정규 랜덤 변수입니다. 데이터의 로그 우도를 다음과 같이 작성할 수 있습니다.

    $$ L (data; k, X_B) = const-\ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai}- k X_B) ^ 2-\ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi}-X_B) ^ 2 $$

    $로이 수량을 최대화 할 수 있어야합니다. k $ 및 $ X_B $를 사용하여 변환 (및 수량 추정값)을 얻습니다.

    사실, $에 대한 로그 우도 함수의 편도 함수를 설정하는 대수를 살펴보면 k $ 및 $ X_B $를 0으로 설정하려면 질문에있는 $ k $에 대한 표현식을 얻어야합니다.

    $ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ 및 $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

    Answer

    필요한 핵심 문서는 GUM (Guide to the Uncertainty in Measurement)-JCGM 100 : 2008 (GUM 1995 사소한 수정 포함) Bureau International de Poids et Mesures / guides / gum 은 한 측정 값의 성능을 평가하는 방법에 대한 전체 (국제 표준) 세부 정보를 제공합니다. 참조 (참조는 이미 평가 가능한 불확실성을 가지고있을 것입니다). 미국 NIST 문서도 이에 직접 기반을두고 있습니다.

    GUM을 사용하면 평가 방법에 대한 선택을 할 수 있지만 두 가지가 있다는 믿음과 같은 모든 가정에 대해 오류 용어를 제공해야합니다. 상품에는 오프셋이 없습니다.

    체계적인 용어와 무작위 용어가 모두 있습니다. 체계적인 용어는 일반적으로 더 큰 오류이며 일반적으로 과소 평가됩니다 (광속에 대한 1900 년대 초의 추정치와 그 오차 막대가 “겹치지 않았습니다!”).

    당신이 있기 때문입니다. 참조 부품이 하나뿐입니다. 지금까지 수행 할 수있는 작업은 두 가지 임의 측정 오류의 상대적 크기를 평가하는 것뿐입니다 (온도, 작업자, 시간과 같은 국소적인 체계적 변동 포함).

    마지막에는 일정 범위의 타당성에 대한 새 판독 값에 대한 오류 및 적용 요인을 명시 할 수 있습니다.

    답글 남기기

    이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다