Ik heb twee verschillende meetinstrumenten, A en B, beide meten dezelfde fysieke grootheid maar met een verschillende maateenheid: $ u_A $ en $ u_B $.
A is een referentie-instrument.
Ik heb een referentiedeel $ L $ $ n $ keer gemeten met A en ik krijg de $ n $ waarden $ L_ { Ai} $ ($ i = 1 \ dots n $) uitgedrukt in de maateenheid $ u_A $.
Vervolgens meet ik hetzelfde referentiedeel, $ L $, $ m $ keer met B en ik krijg de $ m $ waarden $ L_ {Bj} $ ($ j = 1 \ dots m $) uitgedrukt in de maateenheid $ u_B $.
In de toekomst zal ik mijn maten met B, maar ik zal geïnteresseerd zijn in de maat uitgedrukt in de maateenheid $ u_A $.
Ik neem aan dat ik $ u_B $ kan omzetten in $ u_A $ door middel van slechts één multiplicatieve conversiefactor $ k $.
Nu heb ik drie vragen:
-
Is het mogelijk om de geldigheid van de bovenstaande aanname te beoordelen uitgaande van de waarden $ L_ {Ai } $ en $ L_ {Bj} $?
-
Als de aanname klopt, hoe kan ik dan de conversiefactor $ k $ berekenen om de meetwaarde om te rekenen van $ u_B $ naar $ u_A $, dwz $ L_A = k L_B $?
-
Hoe het geval te beheren waarin ik meer dan één deel heb, dwz $ L_1 $, $ L_2 $, enz.
Mijn eerste poging is om aan te nemen de aanname als geldig en bereken dan $ k $ als $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $ maar het is meer gebaseerd op ” gezond verstand “in plaats van op de een of andere goede statistische basis.
Kun je me wat tips geven over het deel van de statistieken dat dit soort problemen behandelt? Misschien lineaire regressie?
Opmerkingen
- Uw methode (zoek naar ” één multiplicatieve conversiefactor “) zou niet werken tussen Fahrenheit en Celsius.
- @Henry Ja, ik weet het, daarom heb ik vraag nummer 1 gesteld.
- Vertel je ons dat je weet dat dezelfde fysieke hoeveelheid wordt gemeten in verschillende eenheden, maar je weet niet hoe de eenheden worden geconverteerd?
- @cbeleites Ja.
- Maar weet je ken je de eenheden?
Antwoord
Op basis van je opmerkingen, wat je wilt doen is een calibratie , die u ook wilt valideren :
je hebt
- referentiemetingen van een temperatuur ( thermometer A), en
- metingen van instrument B dat nog geen thermometer is, omdat u geen reactie krijgt van de fysische hoeveelheidstemperaturen maar van een fysische hoeveelheid zoals b.v. elektronen / s.
Camera-uitlezing is niet dezelfde fysieke grootheid als een temperatuur.
Dus in feite is het jouw taak om de conversie te vinden tussen elektronen / s en temperatuur, dat wil zeggen naar kalibreer de camera-uitvoer op temperaturen.
Ik ben chemometrisch, ik voer kalibraties uit om de uitlezing van instrumenten te relateren aan chemische grootheden. Er zijn hele boeken geschreven over het verkrijgen van een goed kalibratiemodel (uw vraag 2 ) en vervolgens hoe u deze methode valideert (uw vraag 1).
Dus:
Vraag 1: hoe de parameter $ k $ ?
Dit wordt het passen van het kalibratiemodel genoemd.
En dit deel begint eigenlijk met het beslissen wat voor soort model geschikt is. Dit is wat uw aanname (multiplicatief) is.
In de chemometrie worden soms de termen zachte en harde modellen soms gebruikt om onderscheid te maken tussen:
- harde modellen: de ansatz voor het model afleiden uit eerste (globale) principes ,
bijv. beschrijven g camera-uitlezing als functie van temperatuur (bijv. straling van het zwarte lichaam, kwantumefficiëntie van de camera bij verschillende golflengten, …) en vervolgens het oplossen van temperatuur en zoveel mogelijk vereenvoudigen door zoveel mogelijk parameters samen te voegen tot minder parameters die experimenteel bepaald moeten worden. - zachte modellen: modellering van de kalibratiefunctie door benaderingen die onafhankelijk zijn van de exacte fysieke verbinding.
Bijv je mag aannemen dat als je temperatuurbereik smal genoeg is, je de onbekende harde ansatz kunt benaderen door een lineair model. Als dat niet “genoeg is, kan kwadratisch geschikt zijn, enz. Of u kunt een sigmoïd gedrag verwachten, enz.
Aanbeveling 1: denk een beetje na en beslis wat voor soort relatie je verwacht.
Soft modellering is een geldige en veelgebruikte optie, maar je zou in staat moeten zijn om redeneren waarom een vermenigvuldigingsrelatie zinvol is in vergelijking met andere families van functies zoals sigmoïde of exponentieel of logaritmisch.
Vraag 3: wat te doen met meer $ L $ s?
Ik “weet niet zeker of ik goed begrijp wat de verschillende $ L $ s zijn.
-
als het metingen zijn van onderdelen met een andere temperatuur, heb je ze nodig zoals Peter Flom en Gung al zeiden.
Gewoonlijk wordt extrapoleren buiten het gekalibreerde bereik (dwz het temperatuurbereik dat wordt omspannen door uw modelaanpassingsgegevens) niet als geldig beschouwd . U kunt voor een uitzondering pleiten als u de methode valideert (zie hieronder) voor een groter bereik; maar als je een breed scala aan validatiegegevens kunt krijgen, is er geen reden waarom je “ook geen trainingsgegevens voor dat bereik zou kunnen krijgen. -
als je naar de camera verwijst met veel pixels: het hangt af van de eigenschappen van de camera of je redelijkerwijs kunt aannemen dat alle pixels dezelfde kalibratie volgen of dat je elke pixel moet kalibreren.
Vraag 1: Hoe weet je of een multiplicatieve relatie geschikt is? Deel I
In chemometrie wordt multiplicatief zonder intercept zelfs niet gedaan in situaties waarin het harde model een multiplicatieve relatie suggereert (bijv. Beer-Lambert-wet) als er zijn meestal veel dingen in de constructie van instrumenten die tot een onderschepping leiden.
Mijn ervaring suggereert dat een multiplicatieve relatie zonder een onderscheppingsterm zelden geschikt is voor camera-uitlezing.
Bijv. alle camera-uitlezingen I ” waarmee ik tot dusver heb gewerkt, had een vertekening of donkere stroom die een onderschepping in het model zou zijn.
Aanbeveling 2: als je besluit voor een multiplicatief model zonder onderschepping, zou je heel veel moeten kunnen geven goede redenen waarom er mogelijk geen onderschepping kan plaatsvinden. Andersom is dit misschien makkelijker: probeer situaties te bedenken die zouden leiden tot een onderschepping voor de camera-uitlezing. Als je een intercept kunt bedenken, moet je er een in het model opnemen.
De zogenaamde regressiediagnostiek voor lineaire modellen zal je vertellen of het intercept niet van nul kan worden onderscheiden . Dat zou een bewijs zijn dat u in staat stelt een model te passen zonder onderschepping. Evenzo kun je een kwadratisch model passen en kijken of de kwadratische term van nul kan worden onderscheiden.
Vraag 1: Hoe weet je of een multiplicatieve relatie geschikt is? Deel II
Hoewel u bepaalde dingen kunt zien die fout gaan binnen de reeks metingen die wordt gebruikt voor het bouwen van het kalibratiemodel, ” geldig ” betekent meer dan dat. Gewoonlijk betekent dit dat u aantoont dat uw kalibratie met succes kan worden toegepast op het uitlezen van volledig onbekende monsters door de camera (mogelijk gemeten enige tijd nadat de kalibratie is voltooid). Opnieuw is er een hele reeks literatuur voor validatie , en afhankelijk van wat uw exacte veld is, zijn er ook normen die u moet volgen.
In het kort, voor validatie heb je een tweede set metingen nodig die op geen enkele manier betrokken was bij het bouwen van de kalibratie. Vervolgens vergelijkt u de output van het referentie-instrument met de voorspellingen van de kalibratie. Als u naar de afwijkingen kijkt, kunt u verschillende aspecten van de juistheid van uw kalibratie beoordelen:
- bias (dwz uw model heeft een systematische afwijking)
- variantie (willekeurige onzekerheid)
- drift (dwz $ k $ veranderingen in de tijd; vereist een passende planning van metingen )
Wat literatuur
- IUPAC-aanbevelingen: richtlijnen voor kalibratie in analytische chemie. Deel I. Grondbeginselen en kalibratie van één component
Dit is als een norm. - American Laboratory heeft een serie met de naam ” Statistieken in analytische chemie ”
hier veel dingen, inclusief casestudys - Richard G. Brereton: Inleiding tot multivariate kalibratie in analytische chemie, Analyst, 2000, 125, 2125-2154.
lijkt ook univariate kalibratie te omvatten. - Esbensen, KH & Geladi, P. Principles of Proper Validation: gebruik en misbruik van re-sampling voor validatie J. Chemometrics, John Wiley & Sons, Ltd., 2010, 24 , 168-187
geeft een goede discussie waar u rekening mee moet houden bij het kiezen van validatievoorbeelden.
Opmerkingen
- Heel erg bedankt. Heb je suggesties voor een goede online tutorial of een boek?
- @uvts_cvs: ik heb links naar literatuur toegevoegd. De laatste 2 zijn dagboekpapieren die voor u mogelijk achter een betaalmuur staan. Daarnaast zou ik u enkele boeken in de Duitse taal kunnen aanbevelen.
Antwoord
Als u de minder beperkende aanname doet dat de twee metingen verband houden met een lineaire vergelijking, dan : Bij vraag 1 kun je de aanname beoordelen met lineaire regressie. Als het geldig is, moet het snijpunt 0 zijn (of heel dicht bij 0, als er een meetfout is).
Voor vraag 2 zal de coëfficiënt je vertellen welke constante moet worden gebruikt
Ik ben niet zeker van vraag 3, maar het uitvoeren van verschillende meervoudige regressies zou zeer vergelijkbare resultaten moeten geven, tenzij er veel meetfouten zijn.
Bijv. voor Fahrenheit en Celsius:
set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1)
en, met dit zaadje tenminste, de resultaten zijn redelijk dichtbij.
Gegeven dat je meer dan drie metingen met elk instrument, kunt u de initiële aanname beoordelen door een spreidingsdiagram van de twee metingen te tekenen en vervolgens een vloeiende curve te gebruiken, zoals löss of splines. Als de aanname juist is, zal de vloeiende curve vrijwel recht zijn.
Reacties
- Bedankt. Uw codevoorbeeld is zinvol omdat u drie verschillende waarden gebruikt voor
LAbase
, mijn geval lijkt meer opLAbase <- c(10, 10, 10)
waarbijL=10
enn=3
en in dat geval heeft het berekende modelm1
geen betekenis voor mij. - Als je steeds dezelfde waarden krijgt voor LAbase, is er geen manier om iets te doen.
Antwoord
- Uw aanname dat de maten alleen zullen verschillen door een multiplicatieve constante, lijkt mij zeker onjuist. Het feit dat dit niet zou werken voor het omzetten van Fahrenheit naar Celsius, toont dat aan.
- (A.k.a. # 3) U moet meer dan één onderdeel beoordelen. Je hebt niet genoeg vrijheidsgraden om de omrekening tussen de twee metingen te bepalen als je maar één onderdeel gebruikt. Probeer bovendien onderdelen te krijgen waarvan de werkelijke waarden van de metingen een zo groot mogelijk bereik omvatten, en zeker het bereik waarbinnen u de conversie in de toekomst wilt maken.
-
(A.k.a. # 2) U kunt de conversievergelijking bepalen door middel van een regressieanalyse. Met meerdere maatregelen zou je een model met meerdere niveaus kunnen gebruiken, maar ik vermoed dat dit meer is dan nodig is. Als u met elk meetinstrument meerdere maten van elk onderdeel maakt, kunt u gewoon de gemiddelden gebruiken, zoals u beschrijft, om een robuustere maat te krijgen. Dan kun je die twee middelen gewoon gebruiken als je $ x $ en $ y $ waarden voor dat deel. De bèta-schattingen van de regressievergelijking geven u de vereiste verschuiving.
Merk op dat dit niet dezelfde waarden zijn die u via andere conversiestrategieën zou kunnen krijgen, omdat de procedure verschilt; om bijvoorbeeld van Fahrenheit naar Celsius te converteren, kunt u 32 aftrekken en delen door 1,8 , maar om een regressievergelijking te gebruiken, $ \ beta_0 \ ongeveer 18 $ en $ \ beta_1 \ ongeveer 6 $. Dit maakt niet uit, zolang je maar weet welke procedure je gebruikt.
Nog een Het voordeel van de regressiebenadering is overigens dat de conversie tussen twee meetinstrumenten niet per se lineair zal zijn over het mogelijke bereik, wat u met een regressieanalyse wellicht kunt modelleren.
Antwoord
Als u meerdere metingen heeft van dezelfde meerdere keren in de twee eenheden, is er in het algemeen geen manier om de transformatie van de ene eenheid naar de andere te schatten.
Echter, als je wist dat er een multiplicatieve relatie is tussen de twee, en dat de ruis in de twee sets als de metingen nul zijn- gemiddelde normaal (met gelijke varianties of verschillende maar bekende varianties), dan kunt u de vermenigvuldigingsfactor $ k $ schatten met maximale waarschijnlijkheid.
Als u de bovenstaande aannames doet, kunt u als volgt te werk gaan. Laat $ X_B $ de werkelijke waarde zijn van de hoeveelheid die u herhaaldelijk meet in eenheden van $ B $. Vervolgens $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ dots, n $, en $ L_ {Bj} = X_B + f_j $, $ j = 1, \ dots, m $.
$ e_i $ en $ f_j $ zijn normale i.i.d., normale willekeurige variabelen met gemiddelde 0 en variantie $ \ sigma ^ 2 $. U kunt de log-waarschijnlijkheid van de gegevens schrijven als
$$ L (data; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$
U zou deze hoeveelheid moeten kunnen maximaliseren in termen van $ k $ en $ X_B $ om uw transformatie (en een schatting van de hoeveelheid) te verkrijgen.
In feite, als u de algebra doorloopt van het instellen van de partiële afgeleiden van de log-likelihood-functie met betrekking tot $ k $ en $ X_B $ op nul zetten, zou u de uitdrukking voor $ k $ in uw vraag moeten krijgen.
$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ en $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $
Antwoord
Het belangrijkste document dat u nodig heeft is de GUM (Guide to the Uncertainty in Measurement) – JCGM 100: 2008 (GUM 1995 met kleine correcties) Bureau International de Poids et Mesures / gidsen / gom die de volledige (internationale standaard) details geeft over hoe de prestatie van één meting kan worden beoordeeld ten opzichte van een referentie (uw referentie heeft al een beoordeelbare onzekerheid). De Amerikaanse NIST-documenten zijn hier ook rechtstreeks op gebaseerd.
De GUM stelt u in staat uw keuze te maken over de beoordelingsmethode, maar vereist vervolgens dat u een foutterm opgeeft voor eventuele aannames, zoals de overtuiging dat de twee instrumenten hebben geen offset.
Je hebt zowel systematische termen als willekeurige termen. De systematische termen zijn meestal de grootste fouten, en worden vaak ondergewaardeerd (kijk naar de schattingen van begin 1900 voor de lichtsnelheid en hun foutbalken – die elkaar niet overlapten!).
Omdat jij slechts één referentiedeel hebben, alles wat u tot nu toe kunt doen, is de relatieve grootte van de twee willekeurige meetfouten beoordelen (inclusief lokale systematische variatie zoals temperatuur, operator, tijd van de dag ..)
Aan het einde zou je in staat zijn om een fout en een dekkingsfactor te noemen voor je nieuwe metingen over een bepaald geldigheidsbereik.