Ho due diversi strumenti di misura, A e B, entrambi misurano la stessa quantità fisica ma con unità di misura differenti: $ u_A $ e $ u_B $.

A è uno strumento di riferimento.

Ho misurato una parte di riferimento $ L $ $ n $ volte con A e ottengo i valori $ n $ $ L_ { Ai} $ ($ i = 1 \ dots n $) espresso in termini di unità di misura $ u_A $.

Quindi misuro la stessa parte di riferimento, $ L $, $ m $ volte con B e ottengo i $ m $ valori $ L_ {Bj} $ ($ j = 1 \ dots m $) espressi in termini di unità di misura $ u_B $.

In futuro farò il mio misure con B ma mi interesserà la misura espressa in termini di unità di misura $ u_A $.

Presumo di poter convertire $ u_B $ in $ u_A $ mediante un solo fattore di conversione moltiplicativo $ k $.

Ora, ho tre domande:

  1. È possibile valutare la validità dellassunzione di cui sopra partendo dai valori $ L_ {Ai } $ e $ L_ {Bj} $?

  2. Se lipotesi è valida, come posso calcolare il fattore di conversione $ k $ per convertire la misura da $ u_B $ a $ u_A $, cioè $ L_A = k L_B $?

  3. Come gestire il caso in cui ho più di una parte, ad esempio $ L_1 $, $ L_2 $, ecc.

Il mio primo tentativo è supporre lassunzione è valida e quindi calcola $ k $ come $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $ ma si basa maggiormente su ” buon senso “piuttosto che su una base statistica adeguata.

Potete darmi qualche suggerimento sulla parte delle statistiche che copre questo tipo di problema? Forse regressione lineare?

Commenti

  • Il tuo metodo (cercando ” un fattore di conversione moltiplicativo “) non funzionerebbe tra Fahrenheit e Celsius.
  • @Henry Sì, lo so, è per questo motivo che ho posto la domanda numero 1.
  • Ci stai dicendo che sai che la stessa quantità fisica viene misurata in unità diverse ma non sai come vengono convertite le unità?
  • @cbeleites Sì.
  • Ma tu conosci le unità?

Risposta

In base ai tuoi commenti, ciò che vuoi fare è un calibrazione , che desideri anche convalidare :

hai

  • misurazioni di riferimento di una temperatura ( termometro A) e
  • misurazioni di strumento B che non è ancora un termometro, poiché non ottieni risposta delle temperature della quantità fisica ma di una quantità fisica come ad es. elettroni / s.
    La lettura della telecamera non è la stessa quantità fisica di una temperatura.

Quindi in realtà il tuo compito è trovare la conversione tra elettroni / se temperatura, cioè a calibrare luscita della fotocamera in base alle temperature.

Sono un chemometrista, eseguo calibrazioni per correlare la lettura dello strumento a quantità chimiche. Ci sono interi libri scritti sullargomento su come ottenere un buon modello di calibrazione (la tua domanda 2 ) e quindi come convalidare questo metodo (la tua domanda 1).

Quindi:

Domanda 1: come calcolare il parametro $ k $ ?

Questo è chiamato adattamento del modello di calibrazione.

E questa parte in realtà inizia con la decisione del tipo di modello appropriato. Questa è la tua ipotesi (moltiplicativa) è.

In chemiometria, a volte i termini modelli morbidi e duri sono talvolta usati per distinguere:

  • modelli duri: derivare lansatz per il modello dai primi principi (globali) ,
    ad es. descrivendo g lettura della telecamera in funzione della temperatura (es. radiazione del corpo nero, efficienza quantistica della telecamera a diverse lunghezze donda, …) e quindi risolvere per la temperatura e semplificare il più possibile unendo quanti più parametri possibili in meno parametri che devono essere determinati sperimentalmente.
  • modelli soft: modellazione della funzione di calibrazione per approssimazioni indipendenti dallesatta connessione fisica.
    Ad es si può presumere che se lintervallo di temperatura è abbastanza stretto, è possibile approssimare lansatz duro sconosciuto con un modello lineare. Se ciò non è sufficiente, quadratico potrebbe essere appropriato ecc. Oppure, potresti aspettarti un comportamento sigmoideo ecc.

Raccomandazione 1: pensa un po e decidi approssimativamente quale tipo di relazione ti aspetti.

La modellazione morbida è unopzione valida e ampiamente utilizzata, ma dovresti essere in grado di dare ragionando sul perché la relazione moltiplicativa sia sensata rispetto ad altre famiglie di funzioni come sigmoide o esponenziale o logaritmica.

Domanda 3: cosa fare con più $ L $ s?

Non sono sicuro di aver capito correttamente quali sono i diversi $ L $ .

  • se sono misurazioni di parti con altre temperature, ti serviranno come hanno già detto Peter Flom e Gung.
    Di solito, lestrapolazione al di fuori dellintervallo calibrato (ovvero lintervallo di temperatura misurato dai dati di adattamento del modello) non è considerato valido . Puoi chiedere uneccezione se convalidi (vedi sotto) il metodo per un intervallo più ampio; ma se puoi ottenere unampia gamma di dati di convalida, non cè motivo per cui non potresti ottenere dati di addestramento anche per quellintervallo.

  • se ti riferisci alla fotocamera avere molti pixel: dipenderà dalle proprietà della fotocamera se puoi ragionevolmente presumere che tutti i pixel seguano la stessa calibrazione o se devi calibrare ogni pixel.

Domanda 1: Come sapere se la relazione moltiplicativa è appropriata? Parte I

Nella chemiometria, la moltiplicazione senza intercetta non viene nemmeno eseguita in situazioni in cui il modello duro suggerisce una relazione di sola moltiplicazione (ad es. Legge di Beer-Lambert) come di solito ci sono molte cose nella costruzione di strumenti che portano a unintercetta.
La mia esperienza suggerisce che la relazione moltiplicativa senza un termine di intercettazione non è quasi mai appropriata per la lettura della telecamera.
Ad esempio lettura di tutte le telecamere I ” con cui abbiamo lavorato finora aveva una polarizzazione o una corrente oscura che sarebbe stata unintercetta nel modello.

Consiglio 2: se decidi per un modello moltiplicativo senza intercettazione, dovresti essere in grado di fornire molto buone ragioni per cui non è possibile intercettare. Questo può essere più facile viceversa: prova a inventare situazioni che porterebbero a unintercettazione per la lettura della telecamera. Se riesci a trovare unintercetta, dovresti includerla nel modello.

La cosiddetta diagnostica di regressione per i modelli lineari ti dirà se lintercetta non può essere distinta da zero . Sarebbe una prova che ti consente di adattare un modello senza intercettarlo. Allo stesso modo, puoi adattare un modello quadratico e vedere se il termine quadratico può essere distinto da zero.

Domanda 1: Come sapere se la relazione moltiplicativa è appropriata? Parte II

Sebbene tu possa individuare alcune cose che non funzionano allinterno dellinsieme di misurazioni utilizzate per costruire il modello di calibrazione, ” valido ” significa molto di più. Di solito, significa dimostrare che la calibrazione può essere applicata con successo alla lettura della telecamera di campioni completamente sconosciuti (possibilmente misurati qualche tempo dopo che la calibrazione è stata eseguita). Anche in questo caso cè un intero corpo di letteratura per la convalida e, a seconda di quale sia il tuo campo esatto, ci sono anche norme che tu dovrebbe seguire.

In breve, per la convalida è necessario un secondo set di misurazioni che non sia stato coinvolto in alcun modo nella costruzione della calibrazione. Quindi si confronta loutput dello strumento di riferimento con le previsioni della calibrazione. Osservando le deviazioni, è possibile valutare diversi aspetti della correttezza della calibrazione:

  • bias (ovvero il modello ha una sistematica deviazione)
  • varianza (incertezza casuale)
  • deriva (cioè $ k $ cambia nel tempo; richiede unadeguata pianificazione delle misurazioni )

Alcuni testi

Commenti

  • Grazie mille. Hai qualche suggerimento per un buon tutorial online o un libro?
  • @uvts_cvs: ho aggiunto alcuni link alla letteratura. Gli ultimi 2 sono documenti di riviste che potrebbero essere dietro un muro di pagamento per te. Oltre a questo potrei consigliarti alcuni libri in lingua tedesca.

Risposta

Se si assume lipotesi meno restrittiva che le due misurazioni siano correlate da qualche equazione lineare, allora : Per la domanda 1, puoi valutare lipotesi utilizzando la regressione lineare. Se è valido, lintercetta dovrebbe essere 0 (o molto vicino a 0, se cè un errore di misura).

Per la domanda 2, il coefficiente ti dirà la costante da usare

Non sono sicuro della domanda 3, ma eseguire diverse regressioni multiple dovrebbe dare risultati molto simili, a meno che non ci siano molti errori di misurazione.

Ad es. per Fahrenheit e Celsius:

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

e, almeno con questo seme, i risultati sono abbastanza vicini.

Dato che avrai più di tre misurazioni con ogni strumento, è possibile valutare lassunzione iniziale tracciando un grafico a dispersione delle due misurazioni e quindi utilizzando una curva liscia come loess o spline. Se lipotesi è corretta, la curva liscia sarà quasi diritta.

Commenti

  • Grazie. Il tuo codice di esempio è significativo perché utilizzi tre valori diversi per LAbase, il mio caso è più simile a LAbase <- c(10, 10, 10) dove L=10 e n=3 e in tal caso il modello calcolato m1 non è significativo per me.
  • Se ottieni sempre gli stessi valori per LAbase, non cè modo di fare nulla.

Answer

  1. La tua supposizione che le misure differiranno solo per una costante moltiplicativa mi sembra certamente falsa. Il fatto che questo non funzionerebbe per la conversione da Fahrenheit a Celsius lo dimostra.
  2. (aka # 3) Dovrai valutare più di una parte. Non avrai abbastanza gradi di libertà per determinare la conversione tra le due misurazioni se usi solo una parte. Inoltre, cerca di ottenere parti in cui i valori reali delle misurazioni si estendono su un intervallo più ampio possibile e certamente coprono lintervallo entro il quale vorrai effettuare la conversione in futuro.
  3. (Alias # 2) È possibile determinare lequazione di conversione mediante unanalisi di regressione. Con più misure, potresti usare un modello multi-livello, ma sospetto che sia più del necessario. Se effettui diverse misurazioni di ciascuna parte con ogni strumento di misurazione, puoi semplicemente utilizzare le medie, come descrivi, per ottenere una misura più robusta. Quindi puoi semplicemente usare questi due mezzi come valori $ x $ e $ y $ per quella parte. Le stime beta dallequazione di regressione ti daranno lo spostamento richiesto.

    Tieni presente che questi non saranno gli stessi valori che potresti ottenere tramite altre strategie di conversione, tuttavia, perché la procedura è diversa; ad esempio, per convertire da Fahrenheit a Celsius, puoi sottrarre 32 e dividere per 1,8 , ma per utilizzare unequazione di regressione, $ \ beta_0 \ approx18 $ e $ \ beta_1 \ approx.6 $. Non importa, a patto che tu sappia quale procedura stai utilizzando.

    Unaltra Il vantaggio dellapproccio di regressione, tra laltro, è che la conversione tra due strumenti di misurazione non sarà necessariamente lineare per tutto il range possibile, che unanalisi di regressione può consentire di modellare.

Risposta

Se hai diverse misurazioni dello stesso quantità più volte nelle due unità, in generale non cè modo di stimare la trasformazione da ununità allaltra.

Tuttavia, se sapevi che esiste una relazione moltiplicativa tra i due, e che il rumore nei due set se le misurazioni sono zero- significa normale (con varianze uguali o varianze diverse ma note), puoi stimare il fattore moltiplicativo $ k $ per la massima verosimiglianza.

Se fai le ipotesi precedenti puoi procedere come segue. Sia $ X_B $ il valore effettivo della quantità misurata ripetutamente in unità di $ B $. Quindi $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ dots, n $ e $ L_ {Bj} = X_B + f_j $, $ j = 1, \ dots, m $.

$ e_i $ e $ f_j $ sono normali i.i.d., normali variabili casuali con media 0 e varianza $ \ sigma ^ 2 $. Puoi scrivere la probabilità logaritmica dei dati come

$$ L (data; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$

Dovresti essere in grado di massimizzare questa quantità in termini di $ k $ e $ X_B $ per ottenere la tua trasformazione (e una stima della quantità).

Infatti, se passi attraverso lalgebra di impostare le derivate parziali della funzione log-verosimiglianza rispetto a $ k $ e $ X_B $ a zero, dovresti ottenere lespressione per $ k $ che hai nella tua domanda.

$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ e $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

Risposta

Il documento chiave di cui hai bisogno è la GUM (Guide to the Uncertainty in Measurement) – JCGM 100: 2008 (GUM 1995 con correzioni minori) Bureau International de Poids et Mesures / guides / gum che fornisce tutti i dettagli (standard internazionali) su come valutare le prestazioni di una misura rispetto a una riferimento (il tuo riferimento avrà già unincertezza valutabile). Anche i documenti del NIST statunitense si basano direttamente su questo.

Il GUM ti consente di fare la tua scelta sul metodo di valutazione, ma poi richiede che tu fornisca un termine di errore per qualsiasi ipotesi, come la convinzione che i due gli strumenti non hanno offset.

Avrai sia termini sistematici che termini casuali. I termini sistematici sono di solito lerrore maggiore e sono comunemente sottovalutati (guarda le stime dei primi del 1900 per la velocità della luce e le loro barre di errore – che non si sovrapponevano!).

Perché tu hanno solo una parte di riferimento, tutto ciò che puoi fare, finora, è valutare le dimensioni relative dei due errori casuali di misurazione (inclusa la variazione sistematica locale come temperatura, operatore, ora del giorno ..)

Alla fine saresti in grado di indicare un errore e un fattore di copertura per le tue nuove letture su un certo intervallo di validità.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *