Am două instrumente de măsurare diferite, A și B, ambele măsoară aceeași cantitate fizică, dar cu o unitate de măsură diferită: $ u_A $ și $ u_B $.

A este un instrument de referință.

Am măsurat o parte de referință $ L $ $ n $ ori cu A și obțin valorile $ n $ $ L_ { Ai} $ ($ i = 1 \ dots n $) exprimat în termenul unității de măsură $ u_A $.

Apoi măsoară aceeași parte de referință, $ L $, $ m $ ori cu B și obțin valorile $ m $ $ L_ {Bj} $ ($ j = 1 \ dots m $) exprimate în termenul unității de măsură $ u_B $.

În viitor îmi voi face măsoară cu B, dar mă va interesa măsura exprimată în termenul unității de măsură $ u_A $.

Presupun că pot converti $ u_B $ în $ u_A $ prin intermediul unui singur factor de conversie multiplicativ $ k $.

Acum, am trei întrebări:

  1. Este posibil să se evalueze validitatea presupunerii de mai sus pornind de la valorile $ L_ {Ai } $ și $ L_ {Bj} $?

  2. Dacă presupunerea este validă, cum pot calcula factorul de conversie $ k $ pentru a converti măsura de la $ u_B $ la $ u_A $, adică $ L_A = k L_B $?

  3. Cum să gestionez cazul în care am mai mult de o parte, adică $ L_1 $, $ L_2 $ etc.

Prima mea încercare este să-mi asum presupunerea ca validă și apoi calculați $ k $ ca $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $, dar se bazează mai mult pe ” bun simț „mai degrabă decât pe o bază statistică adecvată.

Îmi puteți da câteva indicii cu privire la partea de statistici care acoperă acest tip de problemă? Poate regresia liniară?

Comentarii

  • Metoda dvs. (căutați ” un factor de conversie multiplicativ „) nu ar funcționa între Fahrenheit și Celsius.
  • @Henry Da, știu, din acest motiv am pus întrebarea numărul 1.
  • Ne spuneți că știți că aceeași cantitate fizică este măsurată în unități diferite, dar nu știți cum sunt convertite unitățile?
  • @cbeleites Da.
  • Dar cunoașteți unitățile?

Răspuns

Pe baza comentariilor dvs., ceea ce doriți să faceți este un calibrare , pe care doriți, de asemenea, să valida :

aveți

  • măsurători de referință ale temperaturii ( termometru A) și
  • măsurători ale instrument B care nu este încă un termometru, deoarece nu primiți răspuns a temperaturilor mărimii fizice, dar a unei mărimi fizice ca de ex. electroni / s.
    Citirea camerei nu este aceeași cantitate fizică ca o temperatură.

Deci, de fapt, sarcina dvs. este de a găsi conversia dintre electroni / s și temperatură, adică la calibrați ieșirea camerei la temperaturi.

Sunt „chimiometrician, fac calibrări pentru a lega citirea instrumentului de cantitățile chimice. Există cărți întregi scrise despre cum să obțineți un model de calibrare bun (întrebarea dvs. 2 ) și apoi cum să validați această metodă (întrebarea dvs. 1).

Deci:

Întrebarea 1: cum să calculați parametrul $ k $ ?

Aceasta se numește potrivirea modelului de calibrare.

Și această parte începe de fapt prin a decide ce tip de model este adecvat. Aceasta este ceea ce presupuneți (multiplicativ) este.

În chimiometrie, uneori termenii modele soft și hard sunt uneori folosiți pentru a distinge:

  • modele hard: derivarea ansatzului pentru model din primele principii (globale) ,
    de ex g citirea camerei în funcție de temperatură (de ex. radiații ale corpului negru, eficiența cuantică a camerei la diferite lungimi de undă, …) și apoi rezolvarea temperaturii și simplificarea cât mai mult posibil prin fuzionarea cât mai multor parametri posibil în mai puțini parametri care trebuie determinați experimental.
  • modele soft: modelarea funcției de calibrare prin aproximări care sunt independente de conexiunea fizică exactă.
    De ex puteți presupune că, dacă intervalul dvs. de temperatură este suficient de restrâns, puteți aproxima ansatzul necunoscut cu un model liniar. Dacă acest lucru nu este suficient, quadraticul poate fi adecvat etc. Sau, vă puteți aștepta la un comportament sigmoid etc.

Recomandarea 1: gândiți-vă puțin și decideți la ce tip de relație vă așteptați.

Modelarea soft este o opțiune validă și larg utilizată, dar ar trebui să puteți da raționamentul de ce relația multiplicativă este sensibilă în comparație cu alte familii de funcții precum sigmoidă sau exponențială sau logaritmică.

Întrebarea 3: Ce să faci cu mai mult $ L $ s?

Nu sunt sigur dacă înțeleg corect care sunt diferitele $ L $ .

  • dacă sunt măsurători ale pieselor cu altă temperatură, veți avea nevoie de ele așa cum au spus deja Peter Flom și gung.
    De obicei, extrapolarea în afara intervalului calibrat (adică intervalul de temperatură cuprins de datele de montare a modelului dvs.) nu este considerat valid . Puteți susține o excepție dacă validați (a se vedea mai jos) metoda pentru o gamă mai largă; dar dacă puteți obține o gamă largă de date de validare, nu există niciun motiv pentru care nu puteți obține date de instruire și pentru intervalul respectiv.

  • dacă vă referiți la cameră având mulți pixeli: va depinde de proprietățile camerei dacă puteți presupune în mod rezonabil că toți pixelii urmează aceeași calibrare sau dacă trebuie să calibrați fiecare pixel.

Întrebare 1: Cum se știe dacă relația multiplicativă este adecvată? Partea I

În chimiometrie, multiplicarea fără interceptare nu se face nici măcar în situații în care modelul dur sugerează relația numai multiplicativă (de exemplu, legea Beer-Lambert) ca există, de obicei, multe lucruri în construcția instrumentelor care duc la o interceptare.
Experiența mea sugerează că relația multiplicativă fără un termen de interceptare nu este niciodată adecvată pentru citirea camerei.
De ex. Am lucrat până acum cu o tendință sau un curent întunecat care ar fi o interceptare în model.

Recomandarea 2: dacă decideți pentru un model multiplicativ fără interceptare, ar trebui să puteți da foarte mult motive bune pentru care nu poate apărea nicio interceptare. Acest lucru poate fi mai ușor invers: încercați să inventați situații care ar duce la o interceptare pentru citirea camerei. Dacă puteți veni cu o interceptare, ar trebui să includeți una în model.

Așa-numita diagnosticare de regresie pentru modelele liniare vă va spune dacă interceptarea nu poate fi distinsă de zero . Aceasta ar fi dovezi care vă permit să vă potriviți cu un model fără interceptare. În mod similar, puteți încadra un model pătratic și puteți vedea dacă termenul pătratic poate fi distins de zero.

Întrebarea 1: Cum să știți dacă relația multiplicativă este adecvată? Partea II

Deși puteți observa anumite lucruri care nu funcționează corect în cadrul setului de măsurători utilizate pentru construirea modelului de calibrare, ” valid ” înseamnă mai mult decât atât. De obicei, înseamnă a demonstra că calibrarea dvs. poate fi aplicată cu succes la citirea camerei de probe complet necunoscute (posibil măsurată la ceva timp după ce calibrarea a fost efectuată). Din nou, există un întreg corp de literatură pentru validare și, în funcție de câmpul dvs. exact, există și norme ar trebui să urmeze.

Pe scurt, pentru validare aveți nevoie de un al doilea set de măsurători care nu a fost implicat în niciun fel în construirea calibrării. Apoi comparați ieșirea instrumentului de referință cu predicțiile calibrării. Privind abaterile, puteți evalua mai multe aspecte ale corectitudinii calibrării:

  • părtinire (adică modelul dvs. are un sistematic deviere)
  • varianță (incertitudine aleatorie)
  • derivă (adică $ k $ se modifică în timp; necesită o planificare adecvată a măsurătorilor )

Unele literaturi

Comentarii

  • Vă mulțumesc foarte mult. Aveți sugestii pentru un tutorial online bun sau o carte?
  • @uvts_cvs: Am adăugat câteva linkuri către literatură. Ultimele 2 sunt lucrări de jurnal care ar putea fi în spatele unui perete de plată pentru dvs. În afară de asta, ți-aș putea recomanda câteva cărți în limba germană.

Răspuns

Dacă faceți ipoteza mai puțin restrictivă că cele două măsurători sunt legate de o ecuație liniară, atunci : Pentru întrebarea 1, puteți evalua presupunerea folosind regresia liniară. Dacă este validă, interceptarea ar trebui să fie 0 (sau foarte aproape de 0, dacă există o eroare de măsurare).

Pentru întrebarea 2, coeficientul vă va spune constanta de utilizat

Nu sunt sigur cu privire la întrebarea 3, dar efectuarea mai multor regresii multiple ar trebui să dea rezultate foarte similare, cu excepția cazului în care există o mulțime de erori de măsurare.

De ex. pentru Fahrenheit și Celsius:

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

și, cu această sămânță cel puțin, rezultatele sunt destul de apropiate.

Având în vedere că veți avea mai mult de trei măsurători cu fiecare instrument, puteți evalua presupunerea inițială trasând un diagramă de dispersie a celor două măsurători și apoi utilizând o curbă lină, cum ar fi loess sau splines. Dacă presupunerea este corectă, curba netedă va fi aproape dreaptă.

Comentarii

  • Vă mulțumim. Eșantionul de cod este semnificativ, deoarece utilizați trei valori diferite pentru LAbase, cazul meu seamănă mai mult cu LAbase <- c(10, 10, 10) unde L=10 și n=3 și, în acest caz, modelul calculat m1 nu este semnificativ pentru mine.
  • Dacă obțineți aceleași valori tot timpul pentru LAbase, nu există nicio modalitate de a face nimic.

Răspuns

  1. Presupunerea dvs. că măsurile vor diferi doar printr-o constantă multiplicativă mi se pare cu siguranță falsă. Faptul că acest lucru nu ar funcționa pentru convertirea de la Fahrenheit la Celsius demonstrează acest lucru.
  2. (aka # 3) Va trebui să evaluați mai multe părți. Nu veți avea suficiente grade de libertate pentru a determina conversia între cele două măsurători dacă utilizați o singură parte. Mai mult, încercați să obțineți părți în care valorile adevărate ale măsurătorilor să se întindă pe cât mai mult posibil și, cu siguranță, pe intervalul în care veți dori să faceți conversia în viitor.
  3. (alias # 2) Puteți determina ecuația de conversie prin intermediul unei analize de regresie. Cu măsuri multiple, ați putea folosi un model pe mai multe niveluri, dar bănuiesc că acest lucru este mai mult decât este necesar. Dacă faceți mai multe măsurători ale fiecărei părți cu fiecare instrument de măsurare, puteți utiliza doar mediile, după cum descrieți, pentru a obține o măsură mai robustă. Apoi, puteți utiliza aceste două mijloace ca valorile dvs. $ x $ și $ y $ pentru acea parte. Estimările beta din ecuația de regresie vă vor oferi schimbarea necesară.

    Rețineți că acestea nu vor fi aceleași valori pe care le-ați putea obține prin alte strategii de conversie, totuși, deoarece procedura diferă; de exemplu, pentru a converti de la Fahrenheit la Celsius, puteți scădea 32 și împărți la 1,8 , dar pentru a utiliza o ecuație de regresie, $ \ beta_0 \ approx18 $ și $ \ beta_1 \ approx.6 $. Acest lucru nu contează, atâta timp cât știți ce procedură utilizați.

    Un alt avantajul abordării de regresie, de altfel, este conversia între două instrumente de măsurare câștigate „care nu este neapărat liniară pe tot intervalul posibil, pe care o analiză de regresie vă poate permite să o modelați.

Răspuns

Dacă aveți mai multe măsurători ale același cantitatea de mai multe ori în cele două unități, nu există, în general, nici o modalitate de a estima transformarea de la o unitate la cealaltă.

Cu toate acestea, dacă știați că există o relație multiplicativă între cele două, și că zgomotul din cele două seturi dacă măsurătorile sunt zero- medie normală (cu varianțe egale sau varianțe diferite, dar cunoscute), atunci puteți estima factorul multiplicativ $ k $ în funcție de probabilitatea maximă.

Dacă faceți ipotezele de mai sus, puteți proceda după cum urmează. Fie $ X_B $ valoarea reală a cantității pe care o măsurați în mod repetat în unități de $ B $. Apoi $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ dots, n $ și $ L_ {Bj} = X_B + f_j $, $ j = 1, \ dots, m $.

$ e_i $ și $ f_j $ sunt i.i.d. normale, variabile aleatoare normale cu media 0 și varianța $ \ sigma ^ 2 $. Puteți scrie log-probabilitatea datelor ca

$$ L (date; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$

Ar trebui să puteți maximiza această cantitate în termeni de $ k $ și $ X_B $ pentru a obține transformarea dvs. (și o estimare a cantității).

De fapt, dacă parcurgeți algebra setării derivatelor parțiale ale funcției log-probabilitate în raport cu $ k $ și $ X_B $ la zero, ar trebui să obțineți expresia pentru $ k $ pe care o aveți în întrebare.

$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ și $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

Răspuns

Documentul cheie de care aveți nevoie este GUM (Ghid pentru incertitudinea în măsurare) – JCGM 100: 2008 (GUM 1995 cu corecții minore) Bureau International de Poids et Mesures / guides / gum care oferă detalii complete (standard internațional) despre modul de evaluare a performanței unei măsuri în raport cu un referință (referința dvs. va avea deja o incertitudine evaluabilă). Documentele NIST din SUA se bazează direct și pe acest lucru.

GUM vă permite să alegeți despre metoda de evaluare, dar apoi vă solicită să furnizați un termen de eroare pentru orice ipoteză, cum ar fi credința că cele două instrumentele nu au offset.

Veți avea atât termeni sistematici, cât și termeni aleatori. Termenii sistematici sunt de obicei eroarea cea mai mare și sunt în mod obișnuit sub evaluați (consultați estimările de la începutul anilor 1900 pentru viteza luminii și barele lor de eroare – care nu s-au suprapus!).

aveți o singură parte de referință, tot ce puteți face, până acum, este să evaluați dimensiunile relative ale celor două erori aleatorii de măsurare (inclusiv variația sistematică locală, cum ar fi temperatura, operatorul, ora zilei ..)

La sfârșit, veți putea afirma o eroare și un factor de acoperire pentru noile dvs. citiri într-un anumit interval de validitate.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *