Minulla on kaksi erilaista mittalaitetta, A ja B, jotka molemmat mittaavat samaa fyysistä määrää, mutta eri mittayksiköillä: $ u_A $ ja $ u_B $.
A on vertailuväline.
Mittasin A: lla viiteosan $ L $ $ n $ kertaa ja saan $ n $ -arvot $ L_ { Ai} $ ($ i = 1 \ pistettä n $) ilmaistuna mittayksikön $ u_A $ termillä.
Sitten mitaan saman viiteosan, $ L $, $ m $ kertaa B: llä ja saan $ m $ -arvot $ L_ {Bj} $ ($ j = 1 \ pistettä m $) ilmaistuna mittayksikön $ u_B $ termeinä.
Tulevaisuudessa teen mittaa B: n kanssa, mutta minua kiinnostaa mittayksikön $ u_A $ terminä ilmaistu mitta.
Oletan, että voin muuntaa $ u_B $: ksi $ u_A $: ksi vain yhdellä kerrannaismuunnoskertoimella $ k $.
Minulla on nyt kolme kysymystä:
-
Onko mahdollista arvioida yllä olevan oletuksen pätevyys arvoista $ L_ {Ai alkaen } $ ja $ L_ {Bj} $?
-
Jos oletus on pätevä, kuinka voin laskea muuntokertoimen $ k $, jotta mittari muunnetaan arvosta $ u_B $ arvoon $ u_A $, ts. $ L_A = k L_B $?
-
Kuinka hallita tapausta, jossa minulla on enemmän kuin yksi osa, eli $ L_1 $, $ L_2 $ jne.
Ensimmäinen yritys on olettaa oletus päteväksi ja lasketaan sitten $ k $ arvoksi $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $, mutta se perustuu enemmän ” terve järki ”pikemminkin kuin jollakin asianmukaisella tilastollisella pohjalla.
Voitteko antaa vihjeitä tilastojen osasta, joka kattaa tällaiset ongelmat? Ehkä lineaarinen regressio?
Kommentit
- Menetelmäsi (etsitkö ” yhtä kerrannaismuunnoskerrointa ”) ei toimisi Fahrenheitin ja Celsiuksen välillä.
- @Henry Kyllä tiedän, esitin tästä syystä kysymyksen numero 1.
- Kerrotko meille, että tiedät, että sama fyysinen määrä mitataan eri yksiköissä, mutta et tiedä miten yksiköt muunnetaan?
- @celeeleitit Kyllä.
- Mutta sinä tiedätkö yksiköt?
Vastaa
Kommenttisi perusteella haluat tehdä kalibrointi , jonka haluat myös vahvistaa :
sinulla on
- lämpötilan vertailumittaukset ( lämpömittari A) ja
- lämpötilan mittaukset instrumentti B, joka ei ole vielä lämpömittari, koska et saa vastausta fyysisen määrän lämpötiloista, mutta fysikaalisen määrän, kuten esimerkiksi elektronit / s.
Kameran lukema ei ole sama fyysinen arvo kuin lämpötila.
Joten sinun tehtäväsi on löytää muunnos elektronien / s ja lämpötilan välillä, ts. kalibroi kameran ulostulo lämpötilojen mukaan.
Olen kemometrikko, teen kalibrointeja instrumenttien lukemien ja kemiallisten määrien suhteuttamiseksi. Aiheesta on kirjoitettu kokonaisia kirjoja hyvän kalibrointimallin saamiseksi (kysymyksesi 2 ) ja sitten miten tämä menetelmä validoidaan (kysymyksesi 1).
Joten:
Kysymys 1: kuinka lasketaan parametri $ k $ ?
Tätä kutsutaan kalibrointimallin sovittamiseksi.
Ja tämä osa alkaa itse asiassa päättää, millainen malli on sopiva. Tämä on oletuksesi (multiplikatiivinen) on.
Kemometriassa joskus termejä pehmeät ja kovat mallit käytetään erottamaan toisistaan:
- kovat mallit: johdetaan mallin ansatz ensimmäisistä (globaaleista) periaatteista ,
esim g kameran lukema lämpötilan funktiona (esim. mustan kehon säteily, kameran kvanttitehokkuus eri aallonpituuksilla …) ja sitten lämpötilan ratkaiseminen ja yksinkertaistaminen mahdollisimman paljon yhdistämällä mahdollisimman monta parametria vähemmän parametreihin, jotka on määritettävä kokeellisesti. - pehmeät mallit: kalibrointitoiminnon mallinnus likiarvoilla, jotka ovat riippumattomia tarkasta fyysisestä yhteydestä.
Esim. saatat olettaa, että jos lämpötila-alueesi on riittävän kapea, voit arvioida tuntemattoman kovan ansatin lineaarisella mallilla. Jos tämä ei ole tarpeeksi, neliöllinen voi olla sopiva jne. Tai voit odottaa sigmoidista käyttäytymistä jne.
Suositus 1: ajattele vähän ja päättää karkeasti, minkä tyyppisen suhteen odotat.
Pehmeä mallinnus on kelvollinen ja laajasti käytetty vaihtoehto, mutta sinun pitäisi pystyä antamaan perustelut miksi multiplikatiivinen suhde on järkevä verrattuna muihin funktioperheisiin, kuten sigmoidi- tai eksponentiaalisiin tai logaritmisiin.
Kysymys 3: Mitä tehdä enemmän $ L $ s?
En ole varma, ymmärränkö oikein $ L $ eri.
-
jos ne ovat osien mittauksia muulla lämpötilalla, tarvitset niitä kuten Peter Flom ja Gung jo sanoivat.
Yleensä kalibroidun alueen (ts. mallisi mukaisilla tiedoilla mittaama lämpötila-alue) ekstrapolointia ei pidetä kelvollisena . Voit kiistää poikkeuksen, jos validoit (katso alla) menetelmän laajemmalle alueelle; mutta jos saat laajan valikoiman validointitietoja, ei ole mitään syytä, miksi et voisi hankkia myös kyseisen alueen harjoittelutietoja. -
jos viitat kameraan monta pikseliä: kameran ominaisuuksista riippuu, voitko kohtuudella olettaa, että kaikki pikselit seuraavat samaa kalibrointia vai onko sinun kalibroitava jokainen pikseli.
Kysymys 1: Kuinka tietää, onko multiplikatiivinen suhde sopiva? Osa I
Kemometriassa multiplikatiivista ilman sieppausta ei edes tehdä tilanteissa, joissa kova malli ehdottaa vain multiplikatiivista suhdetta (esim. Beer-Lambert-laki) kuten Instrumenttien rakentamisessa on yleensä monia asioita, jotka johtavat sieppaukseen.
Kokemukseni mukaan moninkertaistussuhde ilman sieppaus termiä tuskin koskaan sopii kameran lukemiseen.
Esim. kaikki kameran lukemat I ” Olen työskennellyt toistaiseksi ollut puolueellisuus tai tumma virta , joka olisi leikkaus mallissa / p>
Suositus 2: jos päätät multiplikatiivisesta mallista ilman sieppausta, sinun pitäisi pystyä antamaan hyvin hyvät syyt, miksi sieppausta ei mahdollisesti tapahdu. Tämä voi olla helpompaa päinvastoin: yritä keksiä tilanteita, jotka johtavat kameran lukemisen sieppaamiseen. Jos pystyt keksimään sieppauksen, sinun tulisi sisällyttää yksi malliin.
Lineaaristen mallien ns. regressiodiagnostiikka kertoo, jos leikkausta ei voida erottaa nollasta. . Se olisi todiste, jonka avulla voit sovittaa mallin ilman sieppausta. Samoin voit sovittaa asteen mallin ja nähdä, voidaanko toissijainen termi erottaa nollasta.
Kysymys 1: Kuinka tietää, onko kertolasku suhde sopiva? Osa II
Vaikka kalibrointimallin rakentamiseen käytettyjen mittausten joukossa voi havaita tiettyjä virheitä, ” kelvollinen ” tarkoittaa enemmän. Yleensä se tarkoittaa sen osoittamista, että kalibrointisi voidaan soveltaa onnistuneesti täysin tuntemattomien näytteiden kameran lukemiseen (mahdollisesti mitattu jonkin aikaa kalibroinnin jälkeen). Jälleen on koko joukko kirjallisuutta validointiin , ja tarkan kentän mukaan on myös normeja, jotka tulisi seurata.
Lyhyesti sanottuna validointia varten tarvitset toisen sarjan mittauksia, jotka eivät olleet millään tavalla mukana kalibroinnin rakentamisessa. Verrataan sitten vertailuvälineen lähtöä kalibroinnin ennusteisiin. Poikkeamia tarkastelemalla voit arvioida useita näkökohtia kalibroinnin oikeellisuudesta:
- ennakkoluulot (eli mallissasi on järjestelmällinen poikkeama)
- varianssi (satunnainen epävarmuus)
- drift (ts. $ k $ muuttuu ajan myötä; vaatii mittausten asianmukaista suunnittelua )
Osa kirjallisuudesta
- IUPAC-suositukset: Kalibroinnin ohjeet analyyttisessä kemiassa. Osa I. Perusteet ja yksittäiskomponenttien kalibrointi
Tämä on kuin normi. - American Laboratorylla on sarja nimeltä ” Analyyttisen kemian tilastot ”
paljon täällä, mukaan lukien tapaustutkimukset - Richard G. Brereton: Johdatus monimuuttujakalibrointiin analyyttisessä kemiassa, analyytikko, 2000, 125, 2125-2154.
näyttää kattavan myös muuttujan kalibroinnin. - Esbensen, KH & Geladi, P.Oikean validoinnin periaatteet: uudelleen näytteenoton käyttö ja väärinkäyttö validointia varten J.Chemometrics, John Wiley & Sons, Ltd., 2010, 24 , 168-187
antaa hyvän keskustelun siitä, mitä sinun on pidettävä mielessä, kun valitset validointinäytteitä.
Kommentit
- Kiitos paljon. Onko sinulla ehdotuksia hyvästä verkko-opetusohjelmasta tai kirjasta?
- @uvts_cvs: Lisäsin joitain linkkejä kirjallisuuteen. Viimeiset 2 ovat päiväkirjalehtiä, jotka saattavat olla sinulle palkkaseinän takana. Sen lisäksi voisin suositella teille saksankielisiä kirjoja.
vastaus
Jos olet vähemmän rajoittava oletus, että nämä kaksi mittausta liittyvät johonkin lineaariseen yhtälöön, niin : Voit arvioida kysymyksen 1 oletuksen lineaarisella regressiolla. Jos se on kelvollinen, sieppauksen tulee olla 0 (tai hyvin lähellä nollaa, jos mittausvirhe on).
Kysymyksessä 2 kerroin kertoo sinulle vakion, jota haluat käyttää
En ole varma kysymyksestä 3, mutta useiden moninkertaisten regressioiden suorittamisen pitäisi antaa hyvin samanlaiset tulokset, ellei mittausvirheitä ole paljon.
Esim. Fahrenheitille ja Celsiukselle:
set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1)
ja ainakin tämän siemenen kanssa tulokset ovat melko lähellä.
Koska sinulla on enemmän kuin kolme mittausta kullakin instrumentilla, voit arvioida alkuperäisen oletuksen piirtämällä hajontakaavion kahdesta mittauksesta ja käyttämällä sitten sileää käyrää, kuten löysiä tai uria. Jos oletus on oikea, sileä käyrä on hyvin lähes suora.
kommentit
- kiitos. Koodinäytteesi on mielekäs, koska käytät kolmea erilaista arvoa ryhmälle
LAbase
, tapaukseni on enemmän kuinLAbase <- c(10, 10, 10)
jossaL=10
jan=3
ja tällöin laskettu mallim1
ei ole minulle merkityksellistä. - Jos saat samat arvot koko ajan LAbaselle, ei ole mitään keinoa tehdä mitään.
Vastaa
- Oletuksesi, että mitat eroavat vain kerrannaisvakion perusteella, vaikuttaa minusta varmasti väärältä. Se, että tämä ei toimisi muunnettaessa Fahrenheitista Celsius-asteiksi, osoittaa tämän.
- (alias # 3) Sinun on arvioitava useampi kuin yksi osa. Sinulla ei ole tarpeeksi vapausasteita kahden mittauksen välisen muunnoksen määrittämiseen, jos käytät vain yhtä osaa. Yritä lisäksi saada osia, joissa mittausten todelliset arvot ulottuvat mahdollisimman suurelle alueelle, ja varmasti alueelle, jolla haluat tehdä muunnoksen tulevaisuudessa.
-
(alias # 2) Voit määrittää muunnosyhtälön regressioanalyysin avulla. Useilla toimenpiteillä voit käyttää monitasoista mallia, mutta epäilen, että tämä on enemmän kuin on välttämätöntä. Jos teet useita mittauksia kustakin osasta jokaisella mittauslaitteella, voit käyttää keskimääräisiä arvoja, kuten kuvaat, saadaksesi vankemman mittauksen. Sitten voit käyttää vain näitä kahta tapaa $ x $ ja $ y $ arvoina kyseiselle osalle. Regressioyhtälön beeta-arviot antavat sinulle tarvittavan muutoksen.
Huomaa, että nämä eivät tule olemaan samat arvot, jotka voisit saada muilla muuntostrategioilla, koska menettely eroaa; esimerkiksi muunnettaessa Fahrenheit-asteikosta Celsius-arvoksi, voit vähentää 32 ja jakaa 1,8 , mutta kun käytetään regressioyhtälöä, $ \ beta_0 \ approx18 $ ja $ \ beta_1 \ approx.6 $. Tällä ei ole merkitystä, kunhan tiedät mitä menettelyä käytät.
Toinen Regressiolähestymisen etuna on muuten kahden mittauslaitteen välinen muunnos, joka ei välttämättä ole lineaarinen kaikilla mahdollisilla alueilla, minkä regressioanalyysi voi antaa sinun mallintaa.
Vastaa
Jos sinulla on useita mittauksia samasta useita kertoja kahdessa yksikössä, ei yleensä ole mitään keinoa arvioida muutosta yksiköstä toiseen.
Jos kuitenkin tiesit että näiden kahden välillä on multiplikatiivinen suhde, ja että näiden kahden joukon melu on jos mittaus on nolla- tarkoittaa keskimääräistä normaalia (yhtä suurilla tai erilaisilla mutta tunnetuilla variansseilla), voit arvioida kerroin $ k $ suurimmalla todennäköisyydellä.
Jos teet yllä olevat oletukset, voit toimia seuraavasti. Olkoon $ X_B $ sen määrän todellinen arvo, jonka mittaat toistuvasti $ B $ -yksikköinä. Sitten $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ pisteet, n $ ja $ L_ {Bj} = X_B + f_j $, $ j = 1, \ pisteet, m $.
$ e_i $ ja $ f_j $ ovat normaalia, eli normaalit satunnaismuuttujat, joiden keskiarvo on 0 ja varianssi $ \ sigma ^ 2 $. Voit kirjoittaa tietojen lokitodennäköisyyden seuraavasti:
$$ L (data; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$
Sinun pitäisi pystyä maksimoimaan tämä määrä dollareina k $ ja $ X_B $ saadaksesi muunnoksesi (ja arvion määrästä).
Itse asiassa, jos käydään läpi algebra, jossa asetetaan log-likelihood -funktion osittaiset derivaatit suhteessa $ k $ ja $ X_B $ nollaan, sinun pitäisi saada lauseke $ k $, joka sinulla on kysymyksessäsi.
$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ ja $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $
Vastaus
Tarvittava avainasiakirja on GUM (opas mittauksen epävarmuuteen) – JCGM 100: 2008 (GUM 1995) pienillä korjauksilla) Bureau International de Poids et Mesures / guides / gum , joka antaa täydelliset (kansainväliset standardit) yksityiskohdat yhden toimenpiteen suorituskyvyn arvioimisesta viite (viitteellesi tulee jo arvattava epävarmuus). Yhdysvaltain NIST-asiakirjat perustuvat myös suoraan tähän.
GUM antaa sinun tehdä valintasi arviointimenetelmästä, mutta vaatii sitten antamaan virhetermin kaikille oletuksille, kuten uskomukselle, että nämä kaksi instrumenteilla ei ole offsetia.
Sinulla on sekä systemaattisia että satunnaisia termejä. Systemaattiset termit ovat yleensä suurempi virhe, ja niitä arvioidaan yleisesti (katso vuoden 1900 alkupuolen arvioita valon nopeudesta ja niiden virhepalkkeista – jotka eivät ole päällekkäisiä!).
Koska sinä vain yksi viiteosa, voit tehdä toistaiseksi vain arvioida kahden satunnaisen mittausvirheen suhteelliset koot (mukaan lukien paikalliset systemaattiset vaihtelut, kuten lämpötila, operaattori, kellonaika ..)
Lopussa voit ilmoittaa virheen ja kattavuuskerroin uusille lukemillesi tietyllä voimassaoloaikalla.