Mám dva různé měřicí přístroje, A a B, oba měří stejnou fyzickou veličinu, ale s různými měrnými jednotkami: $ u_A $ a $ u_B $.

A je referenční nástroj.

Pomocí A jsem změřil referenční část $ L $ $ n $ krát a dostanu hodnoty $ n $ $ L_ { Ai} $ ($ i = 1 \ tečky n $) vyjádřené z hlediska měrné jednotky $ u_A $.

Pak změřím stejnou referenční část, $ L $, $ m $ krát s B a dostanu hodnoty $ m $ $ L_ {Bj} $ ($ j = 1 \ dots m $) vyjádřené v měrné jednotce $ u_B $.

V budoucnu provedu opatření s B, ale bude mě zajímat míra vyjádřená z hlediska měrné jednotky $ u_A $.

Předpokládám, že mohu převést $ u_B $ na $ u_A $ pomocí jediného multiplikativního konverzního faktoru $ k $.

Nyní mám tři otázky:

  1. Je možné posoudit platnost výše uvedeného předpokladu vycházející z hodnot $ L_ {Ai } $ a $ L_ {Bj} $?

  2. Pokud je předpoklad platný, jak mohu vypočítat přepočítací faktor $ k $ pro převod míry z $ u_B $ na $ u_A $, tj. $ L_A = k L_B $?

  3. Jak spravovat případ, kdy mám více než jednu část, tj. $ L_1 $, $ L_2 $ atd.

Můj první pokus je předpokládat předpoklad jako platný a poté vypočítat $ k $ jako $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $, ale je založen spíše na “ zdravý rozum „spíše než na nějakém správném statistickém základě.

Můžete mi dát nějaké náznaky o části statistik, která pokrývá tento druh problému? Možná lineární regrese?

Komentáře

  • Vaše metoda (hledá “ jeden multiplikativní konverzní faktor „) nebude fungovat mezi Fahrenheitem a Celsiem.
  • @Henry Ano, já vím, z tohoto důvodu jsem položil otázku číslo 1.
  • Říkáte nám, že víte, že stejná fyzikální kvantita se měří v různých jednotkách, ale nevíte, jak se jednotky převádějí?
  • @cbeleites Ano.
  • Ale znáte jednotky?

Odpověď

Na základě vašich komentářů chcete kalibrace , kterou chcete také ověřit :

máte

  • referenční měření teploty ( teploměr A) a
  • měření přístroj B, který ještě není teploměr, protože nedostanete odpověď teplot fyzikální veličiny, ale fyzikální veličiny jako např. elektrony / s.
    Odečet kamery není stejné fyzické množství jako teplota.

Vaším úkolem tedy je najít převod mezi elektrony / s a teplotou, tj. na kalibruji výstup z kamery na teploty.

Jsem chemometrik, dělám kalibrace, které souvisí s odečtem přístroje na chemické množství. O tom, jak získat dobrý kalibrační model, jsou napsány celé knihy (vaše otázka 2 ) a poté, jak ověřit tuto metodu (vaše otázka 1).

Takže:

Otázka 1: jak vypočítat parametr $ k $ ?

Tomu se říká přizpůsobení kalibračního modelu.

A tato část vlastně začíná rozhodnutím, jaký typ modelu je vhodný. To je váš předpoklad (multiplikativní) je.

V chemometrii se někdy používají výrazy měkké a tvrdé modely k rozlišení:

  • tvrdé modely: odvození odpovědi pro model od prvních (globálních) principů ,
    např. popis g odečet kamery jako funkce teploty (např. záření černého tělesa, kvantová účinnost kamery při různých vlnových délkách, …) a poté řešení teploty a co největší zjednodušení sloučením co největšího počtu parametrů do menšího počtu parametrů, které je třeba určit experimentálně.
  • soft modely: modelování kalibrační funkce aproximacemi, které jsou nezávislé na přesném fyzickém připojení.
    Např můžete předpokládat, že pokud je váš teplotní rozsah dostatečně úzký, můžete aproximovat neznámou tvrdou odpověď lineárním modelem. Pokud to nestačí, může být vhodné kvadratické atd. Nebo můžete očekávat sigmoidní chování atd.

Doporučení 1: trochu přemýšlejte a zhruba se rozhodněte, jaký typ vztahu očekáváte.

Měkké modelování je platnou a široce používanou možností, ale měli byste být schopni dát uvažování, proč je multiplikativní vztah rozumný ve srovnání s jinými rodinami funkcí, jako jsou sigmoidní nebo exponenciální nebo logaritmické.

Otázka 3: Co dělat s více $ L $ s?

Nejsem si jistý, zda správně rozumím tomu, jaké různé $ L $ jsou.

  • Pokud jde o měření dílů s jinou teplotou, budete je potřebovat, jak již řekl Peter Flom a Gung.
    Extrapolace mimo kalibrovaný rozsah (tj. teplotní rozsah překlenutý vašimi údaji o modelu) se nepovažuje za platný . Výjimku můžete namítnout, pokud ověříte (viz níže) metodu pro širší rozsah; ale pokud můžete získat širokou škálu ověřovacích dat, není důvod, proč byste nemohli získat tréninková data také pro tento rozsah.

  • pokud odkazujete na kameru mít mnoho pixelů: záleží na vlastnostech kamery, zda lze rozumně předpokládat, že všechny pixely sledují stejnou kalibraci, nebo zda je nutné každý pixel kalibrovat.

Otázka 1: Jak zjistit, zda je vhodný multiplikativní vztah? Část I

V chemometrii se multiplikativní bez interceptu neprovádí ani v situacích, kdy tvrdý model navrhuje pouze multiplikativní vztah (např. Beer-Lambertův zákon) jako při konstrukci přístrojů je obvykle mnoho věcí, které vedou k zachycení.
Moje zkušenosti naznačují, že multiplikativní vztah bez zachycovacího výrazu je pro odečet kamery sotva vhodný.
Např. odečet všech kamer I “ Dosud jsme pracovali s předpětím nebo temným proudem , což by bylo zachycení v modelu.

Doporučení 2: pokud se rozhodnete pro multiplikativní model bez zachycení, měli byste být schopni dát velmi dobré důvody, proč nemůže dojít k žádnému zachycení. To může být jednodušší, naopak: zkuste vymyslet situace, které by vedly k zachycení odečtu kamery. Pokud dokážete přijít s průsečíkem, měli byste jej do modelu zahrnout.

Takzvaná regresní diagnostika pro lineární modely vám řekne, zda průsečík nelze odlišit od nuly . To by byl důkaz, který vám umožní umístit model bez zachycení. Podobně můžete přizpůsobit kvadratický model a zjistit, zda lze kvadratický člen odlišit od nuly.

Otázka 1: Jak zjistit, zda je vhodný multiplikativní vztah? Část II

I když můžete v rámci sady měření použitých k sestavení kalibračního modelu pozorovat určité chyby, “ valid “ znamená víc než to. Obvykle to znamená prokázat, že vaši kalibraci lze úspěšně použít na odečet zcela neznámých vzorků kamerou (možná měřenou nějakou dobu po provedení kalibrace). Opět existuje celá řada literatury k validaci a podle toho, jaké máte přesné pole, existují také normy, které by mělo následovat.

Stručně řečeno, pro ověření potřebujete druhou sadu měření, která nebyla žádným způsobem zapojena do vytváření kalibrace. Poté porovnáte výstup referenčního přístroje s předpovědi kalibrace. Při pohledu na odchylky můžete posoudit několik aspektů správnosti vaší kalibrace:

  • zkreslení (tj. Váš model má systematický odchylka)
  • odchylka (náhodná nejistota)
  • drift (tj. $ k $ změny v čase; vyžaduje vhodné plánování měření )

Některá literatura

Komentáře

  • Moc děkuji. Máte nějaké návrhy na dobrý online návod nebo knihu?
  • @uvts_cvs: Přidal jsem několik odkazů na literaturu. Poslední dva jsou deníkové papíry, které pro vás mohou být za výplatní zdí. Kromě toho bych vám mohl doporučit několik knih v německém jazyce.

Odpověď

Pokud učiníte méně omezující předpoklad, že obě měření souvisí s nějakou lineární rovnicí, pak : U otázky 1 můžete posoudit předpoklad pomocí lineární regrese. Pokud je platný, měl by být průsečík 0 (nebo velmi blízko 0, pokud dojde k chybě měření).

U otázky 2 vám koeficient řekne konstantu, kterou chcete použít

Nejsem si jistý otázkou 3, ale provedení několika vícenásobných regresí by mělo poskytnout velmi podobné výsledky, ledaže by došlo k velké chybě měření.

Např. pro Fahrenheita a Celsia:

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

a přinejmenším s tímto počátkem jsou výsledky docela blízké.

Vzhledem k tomu, že budete mít více než tři měření s každým nástrojem, můžete posoudit počáteční předpoklad nakreslením bodového grafu dvou měření a poté použitím hladké křivky, jako je spraše nebo splajny. Pokud je předpoklad správný, hladká křivka bude téměř rovná.

Komentáře

  • Děkuji. Váš ukázkový kód má smysl, protože pro LAbase používáte tři různé hodnoty, můj případ se spíše podobá LAbase <- c(10, 10, 10) kde L=10 a n=3 a v takovém případě pro mě vypočítaný model m1 nemá smysl.
  • Pokud pro LAbase získáte stále stejné hodnoty, není možné nic dělat.

Odpovědět

  1. Váš předpoklad, že se opatření budou lišit pouze multiplikativní konstantou, mi připadá jako jistě mylný. Skutečnost, že by to nefungovalo při přechodu z Fahrenheita na Celsia, to ukazuje.
  2. (A.k.a. # 3) Budete muset posoudit více než jednu část. Pokud použijete pouze jednu část, nebudete mít dostatek stupňů volnosti k určení převodu mezi dvěma měřeními. Kromě toho se pokuste získat části, kde skutečné hodnoty měření pokrývají co největší rozsah, a určitě rozpětí, ve kterém budete chtít v budoucnu provést převod.
  3. (A.k.a. # 2) Rovnici převodu můžete určit pomocí regresní analýzy. S více opatřeními můžete použít víceúrovňový model, ale mám podezření, že je to víc, než je nutné. Pokud provedete několik měření každé části s každým měřicím přístrojem, můžete použít průměrné hodnoty, jak popisujete, abyste získali robustnější míru. Pak můžete tyto dva prostředky použít jako své hodnoty $ x $ a $ y $ pro tuto část. Odhady beta z regresní rovnice vám poskytnou požadovaný posun.

    Všimněte si, že to nebudou stejné hodnoty, jaké byste mohli získat jinými strategiemi převodu, protože postup se liší; například při převodu z Fahrenheita na Celsia můžete odečíst 32 a vydělit 1,8 , ale použít regresní rovnici, $ \ beta_0 \ přibližně 18 $ a $ \ beta_1 \ přibližně 6 $. To nevadí, pokud víte, jaký postup používáte.

    Další mimochodem výhodou regresního přístupu je převod mezi dvěma měřicími nástroji, který nemusí být nutně lineární v celém možném rozsahu, což vám může modelovat regresní analýza.

Odpověď

Pokud máte několik měření stejného množství několikrát ve dvou jednotkách, obecně neexistuje způsob, jak odhadnout transformaci z jedné jednotky na druhou.

Pokud jste však věděli , že mezi nimi existuje multiplikativní vztah, a že šum ve dvou sadách, pokud jsou měření nulová – znamená normální (se stejnými odchylkami nebo různými, ale známými odchylkami), pak můžete odhadnout multiplikativní faktor $ k $ podle maximální pravděpodobnosti.

Pokud vytvoříte výše uvedené předpoklady, můžete postupovat následovně. Nechť $ X_B $ je skutečná hodnota množství, které opakovaně měříte v jednotkách $ B $. Pak $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ dots, n $ a $ L_ {Bj} = X_B + f_j $, $ j = 1, \ dots, m $.

$ e_i $ a $ f_j $ jsou normální i.i.d., normální náhodné proměnné se střední hodnotou 0 a odchylkou $ \ sigma ^ 2 $. Pravděpodobnost dat můžete zapsat jako

$$ L (data; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$

Měli byste být schopni toto množství maximalizovat, pokud jde o $ k $ a $ X_B $ pro získání vaší transformace (a odhad množství).

Ve skutečnosti, když projdete algebrou nastavení částečných derivací funkce log-likelihood s ohledem na $ k $ a $ X_B $ na nulu, měli byste získat výraz pro $ k $, který máte ve své otázce.

$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ a $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

Odpověď

Klíčovým dokumentem, který potřebujete, je GUM (Průvodce nejistotou v měření) – JCGM 100: 2008 (GUM 1995 s drobnými opravami) Bureau International de Poids et Mesures / guidelines / gum , který poskytuje úplné (mezinárodní standard) podrobnosti o tom, jak hodnotit výkonnost jednoho opatření proti reference (vaše reference již bude mít znatelnou nejistotu). Rovněž na tomto jsou založeny dokumenty US NIST.

GUM vám umožňuje vybrat si metodu hodnocení, ale poté vyžaduje zadání chybového termínu pro jakékoli předpoklady, jako je víra, že tyto dva nástroje nemají žádný offset.

Budete mít jak systematické termíny, tak náhodné termíny. Systematické výrazy jsou obvykle větší chybou a obvykle se podhodnocují (podívejte se na odhady rychlosti světla z počátku 20. století a jejich chybové pruhy – které se nepřekrývaly!).

Protože vy pouze jednu referenční část, vše, co můžete udělat, je zatím posoudit relativní velikosti dvou náhodných chyb měření (včetně lokálních systematických variací, jako je teplota, obsluha, denní doba ..)

Na konci byste byli schopni uvést chybu a faktor pokrytí pro vaše nové hodnoty v určitém rozsahu platnosti.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *