Két különböző mérőműszerem van, A és B, mindkettő ugyanazt a fizikai mennyiséget méri, de eltérő mértékegységgel: $ u_A $ és $ u_B $.
A referenciaeszköz.
A referenciarészt $ L $ $ n $ -szor mértem A-val és megkapom a $ n $ értékeket $ L_ { Ai} $ ($ i = 1 \ pont n $) a $ u_A $ mértékegység kifejezésében kifejezve.
Ezután ugyanazt a referenciarészt, $ L $, $ m $ -ot mértem B-vel és megkapom a $ m $ értékeket $ L_ {Bj} $ ($ j = 1 \ pontok m $), amelyek a $ u_B $ mértékegység kifejezésében vannak kifejezve.
A jövőben megadom mér B-vel, de érdekelni fog a $ u_A $ mértékegység kifejezésében kifejezett mérték.
Feltételezem, hogy csak egy multiplikatív konverziós faktor segítségével konvertálhatom a $ u_B $ -t $ u_A $ -ba. $ k $.
Most három kérdésem van:
-
Meg lehet-e értékelni a fenti feltételezés érvényességét a $ L_ {Ai értékekből kiindulva } $ és $ L_ {Bj} $?
-
Ha a feltételezés érvényes, hogyan számíthatom ki a $ k $ konverziós tényezőt, hogy a mértéket $ u_B $ -ról $ u_A $ -ra, azaz $ L_A = k L_B $ -ra konvertáljam?
-
Hogyan kezelhető az az eset, amikor több részem van, azaz $ L_1 $, $ L_2 $ stb.
Első kísérletem az, hogy feltételezem a feltevést érvényesnek, majd kiszámítja a $ k $ értéket mint $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $, de ez inkább ” józan ész “, mint valami megfelelő statisztikai alapon.
Tudna adni néhány tippet a statisztikának az ilyen jellegű problémákat felölelő részéről? Esetleg lineáris regresszió?
Megjegyzések
- Az Ön módszere (” egy multiplikatív konverziós tényezőt keres “) nem működne Fahrenheit és Celsius között.
- @Henry Igen, tudom, éppen ezért feltettem az 1. számú kérdést.
- Azt mondja nekünk, hogy tudja, hogy ugyanazt a fizikai mennyiséget mérik különböző egységekben, de nem tudja, hogyan alakítják át az egységeket?
- @cbeleites Igen.
- De ismeri az egységeket?
Válasz
Megjegyzései alapján azt szeretné megtenni, hogy kalibrálás , amelyet érvényesíteni is akar :
rendelkezik
- a hőmérséklet referencia méréseivel ( hőmérő A) és
- eszköz B, amely még nem hőmérő, mivel nem kap választ a fizikai mennyiségi hőmérsékletek, de egy olyan fizikai mennyiség, mint pl. elektronok / s.
A kamera kiolvasása nem ugyanaz a fizikai mennyiség, mint a hőmérséklet.
Tehát valójában az a feladata, hogy megtalálja az elektronok / s és a hőmérséklet közötti konverziót, azaz kalibrálja a fényképezőgép kimenetét a hőmérsékletre.
Kémometrikus vagyok, kalibrálok, hogy a műszer kiolvasását összekapcsoljam a kémiai mennyiségekkel. Egész könyveket írtak arról a témáról, hogyan lehet jó kalibrációs modellt beszerezni (2. kérdés ), majd hogyan érvényesítse ezt a módszert (az 1. kérdés).
Tehát:
1. kérdés: a $ k paraméter kiszámítása $ ?
Ezt nevezzük a kalibrációs modell illesztésének.
És ez a rész valójában azzal kezdődik, hogy eldöntsük, milyen modell megfelelő. Ezt feltételezi (multiplikatív) van.
A kemometriában néha a puha és kemény modell kifejezésekkel szokták megkülönböztetni:
- kemény modellek: a modell ansatz-jának levezetése az első (globális) elvektől ,
pl g kamera leolvasása a hőmérséklet függvényében (pl. fekete test sugárzás, a kamera kvantumhatékonysága különböző hullámhosszakon, …), majd megoldása a hőmérsékletre és a lehető legnagyobb mértékben egyszerűsítés a lehető legtöbb paraméter összevonásával kevesebb paraméterbe, amelyeket kísérletileg kell meghatározni. - soft modellek: a kalibrációs függvény modellezése a pontos fizikai kapcsolattól független közelítésekkel.
Pl. feltételezhetjük, hogy ha a hőmérsékleti tartománya elég szűk, akkor az ismeretlen kemény ansatzot lineáris modellel közelítheti meg. Ha ez nem elég, a másodfokú lehet megfelelő stb. Vagy szignifikáns viselkedésre számíthat stb.
1. ajánlás: gondolkodj egy kicsit, és nagyjából döntsd el, milyen típusú kapcsolatra számítasz.
A puha modellezés érvényes és széles körben alkalmazott lehetőség, de képesnek kell lennie arra, hogy annak indoklása, hogy a multiplikatív kapcsolat miért értelmes-e más függvénycsaládokhoz képest, például sigmoid vagy exponenciális vagy logaritmikus.
3. kérdés: Mit kell kezdeni több $ L $ s?
Nem vagyok biztos benne, hogy jól értem-e, mi a különböző $ L $ .
-
ha más hőmérsékletű alkatrészek méréséről van szó, akkor szükséged lesz rájuk, ahogy Peter Flom és Gung már mondta.
Általában a kalibrált tartományon kívüli extrapolálás (azaz a modell illesztési adatainak által lefedett hőmérsékleti tartomány) . Érvelhet egy kivétel mellett, ha a módszert szélesebb tartományra érvényesíti (lásd alább); de ha az ellenőrzési adatok széles skáláját szerezheti meg, nincs oka annak, hogy az adott tartományra vonatkozóan sem kaphatna edzésadatokat. -
ha a kamerára hivatkozik sok pixel van: a kamera tulajdonságaitól függ, hogy ésszerűen feltételezheti-e, hogy az összes kép ugyanazt a kalibrációt követi, vagy minden egyes pixelt kalibrálni kell.
Kérdés 1. rész: Hogyan lehet megtudni, hogy a multiplikatív kapcsolat megfelelő-e? I. rész
A kemometriában a intercept nélküli szorzást még olyan helyzetekben sem végzik el, amikor a kemény modell csak multiplikatív kapcsolatot javasol (pl. Beer-Lambert-törvény), a műszerek felépítésénél általában sok dolog van, amely lehallgatáshoz vezet.
Tapasztalataim szerint a szorzótag nélküli multiplikatív kapcsolat alig alkalmas a kamera kiolvasására.
Pl. az összes kamera kiolvasása I ” eddig dolgoztunk elfogultsággal vagy sötét árammal , amely a modell elfogása lenne / p>
2. ajánlás: ha elfogás nélküli multiplikatív modell mellett dönt, akkor képesnek kell lennie arra, hogy nagyon jó okok arra, hogy miért nem történhet lehallgatás. Ez fordítva is könnyebb lehet: próbáljon olyan helyzeteket kitalálni, amelyek a kamera leolvasásának elfogásához vezetnek. Ha sikerül előállni egy elfogással, akkor be kell építeni egyet a modellbe.
A lineáris modellek úgynevezett regressziós diagnosztikája megmondja, hogy az elfogás nem különböztethető-e meg a nullától. . Ez bizonyíték lehet arra, hogy lehallgatás nélkül illeszkedjen egy modellhez. Hasonlóképpen beilleszthet egy másodfokú modellt, és megnézheti, hogy a másodfokú kifejezés elkülöníthető-e a nullától.
1. kérdés: Hogyan lehet megtudni, hogy a multiplikatív kapcsolat megfelelő-e? II. Rész
Bár észlelhet bizonyos hibákat, amelyek hibásak a kalibrációs modell felépítéséhez használt méréssorozaton belül, ” érvényes ” ennél többet jelent. Általában ez azt jelenti, hogy bemutatja, hogy a kalibrálás sikeresen alkalmazható a teljesen ismeretlen minták kamerájának kiolvasására (esetleg a kalibrálás elvégzése után valamivel később mérhető). Ismét egy teljes szakirodalom van érvényesítésre , és attól függően, hogy mi a pontos területe, vannak olyan normák is, amelyeket Ön
Röviden, az érvényesítéshez szükség van egy második méréskészletre, amely semmilyen módon nem vett részt a kalibrálás felépítésében. Ezután összehasonlítja a referencia eszköz kimenetét a kalibrálás előrejelzéseivel. Az eltéréseket tekintve felmérheti a kalibrálás helyességének több szempontját:
- torzítás (azaz a modellje szisztematikus eltérés)
- szórás (véletlenszerű bizonytalanság)
- sodródás (azaz a $ k $ idővel változik; a mérések megfelelő tervezését igényli )
Néhány szakirodalom
- IUPAC ajánlások: Irányelvek az analitikai kémia kalibrálásához. I. rész Alapismeretek és egykomponensű kalibrálás
Ez olyan, mint egy norma. - Az American Laboratory Az analitikai kémia statisztikája ”
itt sok minden, ideértve az esettanulmányokat is - Richard G. Brereton: Bevezetés a többváltozós kalibrálásba az analitikai kémia területén, Analyst, 2000, 125, 2125-2154.
úgy tűnik, hogy az egyváltozós kalibrálást is lefedi. - Esbensen, KH & Geladi, P. A megfelelő validálás elvei: az új mintavétel használata és visszaélés az érvényesítéshez J. Chemometrics, John Wiley & Sons, Ltd., 2010, 24 , 168-187
jól megvitatja, mit kell szem előtt tartania az ellenőrzési minták kiválasztásakor.
Megjegyzések
- Nagyon köszönöm. Van javaslata egy jó online oktatóanyagra vagy könyvre?
- @uvts_cvs: Hozzáadtam néhány linket az irodalomhoz. Az utóbbi 2 olyan folyóiratcikk, amely a fizetési fal mögött állhat. Emellett tudok ajánlani néhány könyvet német nyelven.
Válasz
Ha azt a kevésbé korlátozó feltevést feltételezi, hogy a két mérést valamilyen lineáris egyenlet kapcsolja össze, akkor : Az 1. kérdésnél lineáris regresszióval értékelheti a feltételezést. Ha érvényes, akkor az elfogásnak 0-nak kell lennie (vagy nagyon közel 0-nak, ha mérési hiba van).
A 2. kérdésnél az együttható megmondja a használandó állandót
Nem vagyok biztos a 3. kérdésben, de többszörös regresszió végrehajtásával nagyon hasonló eredményeket kell adni, hacsak nincs sok mérési hiba.
Pl. Fahrenheit és Celsius esetében:
set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1)
és legalább ezzel a maggal az eredmények meglehetősen szorosak.
Tekintettel arra, hogy több mint három mérés mindegyik műszerrel, értékelheti a kezdeti feltételezést úgy, hogy megrajzolja a két mérés szórási sávját, majd sima görbét használ, például lösz vagy spline. Ha a feltételezés helyes, a sima görbe majdnem egyenes lesz.
megjegyzések
- köszönöm. A kódminta azért értelmes, mert három különböző értéket használ a
LAbase
elemhez, esetem inkábbLAbase <- c(10, 10, 10)
, aholL=10
ésn=3
, és ebben az esetben a számítottm1
modell számomra nem értelmes. - Ha mindig ugyanazokat az értékeket kapja az LAbase számára, akkor semmire sem lehet mód.
Válasz
- Az a feltételezésed, hogy az intézkedések csak egy multiplikatív konstanssal különböznek egymástól, bizonyosan hamisnak tűnik. Az a tény, hogy ez nem működne a Fahrenheitből Celsiusra való átszámításhoz, ezt bizonyítja.
- (A.k.a. # 3) Több részt kell értékelnie. Ha csak egy részt használ, akkor nem lesz elegendő szabadságfoka a két mérés közötti konverzió meghatározásához. Ezenkívül próbáljon meg olyan részeket beszerezni, ahol a mérések valódi értéke a lehető legnagyobb tartományt öleli fel, és minden bizonnyal azon a tartományon belül, amelyen belül a jövőben az átalakítást szeretné végrehajtani.
-
(A.k.a. # 2) A konverziós egyenletet regresszióanalízissel határozhatja meg. Többféle intézkedéssel többszintű modellt is használhatna, de gyanítom, hogy ez több, mint amire szükség van. Ha mindegyik alkatrészről több mérést végez minden mérőeszközzel, akkor az átlagokat használhatja, amint leírja, egy erőteljesebb méréshez. Ezután csak ezt a két eszközt használhatja az adott rész $ x $ és $ y $ értékeként. A regressziós egyenlet béta-becslései megadják a szükséges elmozdulást.
Ne feledje, hogy ezek nem lesznek ugyanazok az értékek, amelyeket más konverziós stratégiákon keresztül kaphatna, mivel az eljárás eltér; például ha Fahrenheit-ról Celsiusra kíván konvertálni, kivonhat 32-et és eloszthatja 1,8-mal. , de regressziós egyenlet használatához a $ \ beta_0 \ kb18 $ és $ \ beta_1 \ kb.6 $. Ez nem számít, mindaddig, amíg tudja, hogy melyik eljárást használja.
Egy másik A regressziós megközelítés előnye egyébként, hogy a két mérőműszer közötti konverzió nem lesz szükségszerűen lineáris a lehetséges tartományban, amelyet a regressziós elemzés lehetővé tehet a modellezéshez.
Válasz
Ha több mérése van az ugyanaz nak mennyisége többször is a két egységben, általában nincs mód megbecsülni az egyik egységből a másikba történő átalakulást.
Ha azonban tudta , hogy multiplikatív összefüggés van a kettő között, és hogy a zaj a két halmazban, ha a mérések nulla- átlagos normál érték (egyenlő eltérésekkel vagy különböző, de ismert varianciákkal), akkor megbecsülheti a $ k $ szorzótényezőt a maximális valószínűség szerint.
Ha a fenti feltételezéseket teszi, a következőképpen járhat el. Legyen $ X_B $ annak a mennyiségnek a tényleges értéke, amelyet ismételten mér $ B $ egységekben. Ezután $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ pontok, n $ és $ L_ {Bj} = X_B + f_j $, $ j = 1, \ pontok, m $.
A $ e_i $ és $ f_j $ normális, azaz normál, véletlenszerű változók 0-val és szórással $ \ sigma ^ 2 $. Az adatok naplózási valószínűségét a következőképpen írhatja:
$$ L (data; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$
Ezt a mennyiséget maximalizálni kell dollárban k $ és $ X_B $ az átalakítás megszerzéséhez (és a mennyiség becsléséhez).
Valójában ha átmész az algebrán a log-likelihood függvény részleges deriváltjainak beállításához a $ vonatkozásában k $ és $ X_B $ nulla értékre, meg kell kapnia a kérdésében szereplő $ k $ kifejezést.
$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ és $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $
Válasz
A legfontosabb dokumentum a GUM (Útmutató a mérés bizonytalanságához) – JCGM 100: 2008 (GUM 1995) kisebb javításokkal) a Nemzetközi Poidok és Mesúrák / Útmutatók / Gumi Iroda, amely teljes (nemzetközi szabvány) részleteket tartalmaz arról, hogyan lehet egy intézkedés teljesítményét értékelni egy referencia (a referenciádnak már lesz meghatározható bizonytalansága). Az US NIST dokumentumok közvetlenül ezen is alapulnak.
A GUM lehetővé teszi, hogy döntést hozzon az értékelési módszerről, de ezután megköveteli, hogy adjon meg egy hibát az összes feltételezéshez, mint például a meggyőződés, hogy a kettő az eszközöknek nincs eltolódása.
Szisztematikus és véletlenszerű kifejezéseket egyaránt használhat. A szisztematikus kifejezések általában a nagyobb hibát jelentik, és általában alulértékelik őket (nézze meg az 1900-as évek eleji becsléseket a fénysebességről és hibasávjairól – amelyek nem fedték egymást!).
Mert Ön csak egy referencia rész van, eddig csak annyit tehet, hogy felméri a két véletlenszerű mérési hiba relatív nagyságát (beleértve a helyi szisztematikus variációkat, például a hőmérsékletet, az operátort, a napszakot ..)
A végén megadhat egy hibát és egy lefedettségi tényezőt az új olvasmányokhoz, bizonyos érvényességi tartományon belül.