Mam dwa różne przyrządy pomiarowe, A i B, oba mierzą tę samą wielkość fizyczną, ale z różnymi jednostkami miary: $ u_A $ i $ u_B $.

A jest instrumentem odniesienia.

Zmierzyłem część odniesienia $ L $ $ n $ razy za pomocą A i otrzymałem wartości $ n $ $ L_ { Ai} $ ($ i = 1 \ dots n $) wyrażone jako jednostka miary $ u_A $.

Następnie mierzę tę samą część odniesienia, $ L $, $ m $ razy za pomocą B i otrzymuję $ m $ wartości $ L_ {Bj} $ ($ j = 1 \ dots m $) wyrażone w jednostce miary $ u_B $.

W przyszłości zrobię moje miary z B, ale będę zainteresowany miarą wyrażoną w jednostce miary $ u_A $.

Zakładam, że mogę zamienić $ u_B $ na $ u_A $ za pomocą tylko jednego mnożnika przeliczeniowego $ k $.

Teraz mam trzy pytania:

  1. Czy można ocenić słuszność powyższego założenia zaczynając od wartości $ L_ {Ai } $ i $ L_ {Bj} $?

  2. Jeśli założenie jest słuszne, w jaki sposób mogę obliczyć współczynnik konwersji $ k $, aby przeliczyć miarę z $ u_B $ na $ u_A $, czyli $ L_A = k L_B $?

  3. Jak zarządzać przypadkiem, w którym mam więcej niż jedną część, tj. $ L_1 $, $ L_2 $ itd.

Pierwszą próbą jest założenie założenie jest prawidłowe, a następnie obliczyć $ k $ jako $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $, ale opiera się bardziej na ” zdrowy rozsądek ”, a nie na jakiejś właściwej podstawie statystycznej.

Czy możesz mi podać kilka wskazówek dotyczących części statystyk, która obejmuje tego rodzaju problemy? Może regresja liniowa?

Komentarze

  • Twoja metoda (szukanie ” jednego multiplikatywnego współczynnika konwersji „) nie działałyby między stopniami Fahrenheita i Celsjusza.
  • @Henry Tak wiem, to z tego powodu zadałem pytanie numer 1.
  • Czy chcesz nam powiedzieć, że wiesz, że ta sama wielkość fizyczna jest mierzona w różnych jednostkach, ale nie wiesz, jak te jednostki są konwertowane?
  • @cbeleites Tak.
  • Ale czy ty znasz jednostki?

Odpowiedź

Na podstawie twoich komentarzy, co chcesz zrobić, to kalibracja , którą również chcesz zweryfikować :

masz

  • referencyjne pomiary temperatury ( termometr A), oraz
  • pomiary instrument B, który nie jest jeszcze termometrem, ponieważ nie otrzymujesz odpowiedzi temperatury wielkości fizycznej, ale wielkości fizycznej, takiej jak np. elektronów / s.
    Odczyt z kamery nie jest tą samą wielkością fizyczną, co temperatura.

W rzeczywistości twoim zadaniem jest znalezienie konwersji między elektronami / s a temperaturą, tj. skalibruj wyjście kamery do temperatur.

Jestem chemometrem, wykonuję kalibracje, aby powiązać odczyt przyrządu z ilościami chemicznymi. Istnieją całe książki napisane na temat tego, jak uzyskać dobry model kalibracyjny (twoje pytanie 2 ), a następnie jak sprawdzić poprawność tej metody (Twoje pytanie 1).

A więc:

Pytanie 1: jak obliczyć parametr $ k $ ?

Nazywa się to dopasowywaniem modelu kalibracyjnego.

Ta część zaczyna się właściwie od ustalenia, jaki rodzaj modelu jest odpowiedni. Takie jest Twoje założenie (multiplikatywne) jest.

W chemometrii czasami używa się terminów miękkich i twardych modeli, aby rozróżnić:

  • modele twarde: wyprowadzenie ansatz dla modelu z pierwszych (globalnych) zasad ,
    np. opis g odczyt z kamery w funkcji temperatury (np. promieniowanie ciała doskonale czarnego, wydajność kwantowa kamery przy różnych długościach fal, …), a następnie rozwiązywanie dla temperatury i maksymalne uproszczenie poprzez połączenie jak największej liczby parametrów w mniejszą liczbę parametrów, które należy określić eksperymentalnie.
  • modele miękkie: modelowanie funkcji kalibracji za pomocą przybliżeń, które są niezależne od dokładnego fizycznego połączenia.
    Np możesz założyć, że jeśli twój zakres temperatur jest wystarczająco wąski, możesz przybliżyć nieznane twarde ansatz modelem liniowym. Jeśli to nie wystarczy, metoda kwadratowa może być odpowiednia itp. Możesz też spodziewać się sigmoidalnego zachowania itp.

Zalecenie 1: pomyśl trochę i zdecyduj z grubsza, jakiego rodzaju relacji oczekujesz.

Miękkie modelowanie jest ważną i szeroko stosowaną opcją, ale powinieneś być w stanie dać uzasadnienie, dlaczego relacja multiplikatywna jest rozsądna w porównaniu z innymi rodzinami funkcji, takich jak sigmoida, wykładnicza lub logarytmiczna.

Pytanie 3: Co zrobić z większą ilością $ L $ s?

Nie jestem pewien, czy dobrze rozumiem, czym są różne $ L $ .

  • jeśli są to pomiary części o innej temperaturze, będziesz ich potrzebować, jak powiedział Peter Flom i Gung.
    Zazwyczaj ekstrapolacja poza skalibrowanym zakresem (tj. zakres temperatur obejmowany przez dane dopasowania modelu) nie jest uważana za prawidłową . Możesz argumentować za wyjątkiem, jeśli zweryfikujesz (patrz poniżej) metodę dla szerszego zakresu; ale jeśli możesz uzyskać szeroki zakres danych walidacyjnych, nie ma powodu, dla którego nie mógłbyś również uzyskać danych treningowych dla tego zakresu.

  • jeśli odwołasz się do aparatu posiadanie wielu pikseli: od właściwości kamery będzie zależało, czy można rozsądnie założyć, że wszystkie piksele podlegają tej samej kalibracji, czy też należy skalibrować każdy piksel.

Pytanie 1: Skąd wiadomo, czy relacja multiplikatywna jest odpowiednia? Część I

W chemometrii mnożenia bez wyrazu wolnego nie wykonuje się nawet w sytuacjach, w których model twardy sugeruje zależność tylko multiplikatywną (np. Prawo Beera-Lamberta) jako zwykle w konstrukcji instrumentów jest wiele rzeczy, które prowadzą do przechwycenia.
Z mojego doświadczenia wynika, że relacja multiplikatywna bez wyrazu przechwytującego prawie nigdy nie nadaje się do odczytu z kamery.
Np. odczyt z kamery I Pracowałem z do tej pory miał odchylenie lub prąd ciemny , który byłby punktem przecięcia w modelu.

Zalecenie 2: jeśli zdecydujesz się na model multiplikatywny bez przecięcia, powinieneś być w stanie podać bardzo dobre powody, dla których nie może dojść do przechwycenia. W drugą stronę może być łatwiej: spróbuj wymyślić sytuacje, które doprowadziłyby do przechwycenia odczytu z kamery. Jeśli możesz wymyślić punkt przecięcia z osią, powinieneś uwzględnić go w modelu.

Tak zwana diagnostyka regresji dla modeli liniowych powie Ci, czy nie można odróżnić punktu przecięcia z zerem . To byłby dowód, który pozwala dopasować model bez przecięcia. Podobnie, możesz dopasować model kwadratowy i sprawdzić, czy termin kwadratowy można odróżnić od zera.

Pytanie 1: Jak sprawdzić, czy relacja multiplikatywna jest odpowiednia? Część II

Chociaż możesz zauważyć, że pewne rzeczy idą źle w zestawie pomiarów użytych do zbudowania modelu kalibracji, ” prawidłowe ” oznacza coś więcej. Zwykle oznacza to wykazanie, że kalibrację można z powodzeniem zastosować do odczytu z kamery całkowicie nieznanych próbek (prawdopodobnie mierzonych jakiś czas po wykonaniu kalibracji). Ponownie istnieje cała literatura na temat walidacji . W zależności od tego, czym się zajmujesz, są też normy, należy postępować.

Krótko mówiąc, do walidacji potrzebny jest drugi zestaw pomiarów, który nie był w żaden sposób zaangażowany w tworzenie kalibracji. Następnie porównujesz wyniki instrumentu referencyjnego z przewidywaniami kalibracji. Patrząc na odchylenia, możesz ocenić kilka aspektów poprawności kalibracji:

  • odchylenie (tj. Model ma systematyczne odchylenie)
  • wariancja (niepewność losowa)
  • dryft (tj. $ k $ zmienia się w czasie; wymaga odpowiedniego planowania pomiarów )

Literatura

Komentarze

  • Bardzo dziękuję. Czy masz jakieś sugestie dotyczące dobrego samouczka lub książki online?
  • @uvts_cvs: Dodałem kilka linków do literatury. Ostatnie 2 to artykuły w czasopismach, które mogą znajdować się za tablicą z wypłatami. Poza tym mógłbym polecić kilka książek w języku niemieckim.

Odpowiedź

Jeśli przyjmiesz mniej restrykcyjne założenie, że te dwa pomiary są powiązane pewnym równaniem liniowym, to : W przypadku pytania 1 można ocenić założenie za pomocą regresji liniowej. Jeśli jest poprawne, punkt przecięcia powinien wynosić 0 (lub bardzo blisko 0, jeśli występuje błąd pomiaru).

W przypadku pytania 2 współczynnik poda stałą, której należy użyć.

Nie jestem pewien co do pytania 3, ale wykonanie kilku wielokrotnych regresji powinno dać bardzo podobne wyniki, chyba że występuje duży błąd pomiaru.

Np. dla Fahrenheita i Celsjusza:

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

i przynajmniej przy tym ziarnie wyniki są dość zbliżone.

Biorąc pod uwagę, że będziesz mieć więcej niż trzy pomiary dla każdego instrumentu, można ocenić początkowe założenie, rysując wykres rozrzutu dwóch pomiarów, a następnie stosując gładką krzywą, taką jak less lub wielowypust. Jeśli założenie jest poprawne, gładka krzywa będzie prawie prosta.

Komentarze

  • Dziękuję. Twój przykładowy kod ma znaczenie, ponieważ używasz trzech różnych wartości dla LAbase, mój przypadek przypomina bardziej LAbase <- c(10, 10, 10), gdzie L=10 i n=3 iw takim przypadku obliczony model m1 nie ma dla mnie znaczenia.
  • Jeśli przez cały czas otrzymujesz te same wartości dla LAbase, nie ma sposobu, aby cokolwiek zrobić.

Odpowiedź

  1. Twoje założenie, że miary będą różnić się jedynie o stałą multiplikatywną, wydaje mi się z pewnością fałszywe. Dowodzi tego fakt, że nie zadziała to przy zamianie stopni Fahrenheita na stopnie Celsjusza.
  2. (A.k.a. # 3) Będziesz musiał ocenić więcej niż jedną część. Jeśli używasz tylko jednej części, nie będziesz mieć wystarczającej liczby stopni swobody, aby określić konwersję między dwoma pomiarami. Ponadto postaraj się uzyskać części, w których prawdziwe wartości pomiarów obejmują jak największy zakres, a na pewno obejmują zakres, w którym będziesz chciał dokonać konwersji w przyszłości.
  3. (A.k.a. # 2) Możesz określić równanie konwersji za pomocą analizy regresji. Przy wielu miarach można by zastosować model wielopoziomowy, ale podejrzewam, że to więcej niż jest to konieczne. Jeśli wykonasz kilka pomiarów każdej części za pomocą każdego przyrządu pomiarowego, możesz po prostu użyć średnich, jak opisujesz, aby uzyskać bardziej dokładny pomiar. Następnie możesz użyć tych dwóch średnich jako wartości $ x $ i $ y $ dla tej części. Szacunki beta z równania regresji dadzą wymagane przesunięcie.

    Pamiętaj, że nie będą to te same wartości, które można uzyskać za pomocą innych strategii konwersji, ponieważ procedura jest inna; na przykład, aby przeliczyć stopnie Fahrenheita na stopnie Celsjusza, możesz odjąć 32 i podzielić przez 1,8 , ale aby użyć równania regresji, $ \ beta_0 \ około 18 $ i $ \ beta_1 \ około 6 $. To nie ma znaczenia, o ile wiesz, której procedury używasz.

    Kolejna Nawiasem mówiąc, zaletą podejścia regresji jest konwersja między dwoma instrumentami pomiarowymi, które nie muszą być liniowe w całym możliwym zakresie, co może umożliwić modelowanie za pomocą analizy regresji.

Odpowiedź

Jeśli masz kilka pomiarów tego samego ilość kilkukrotnie w obu jednostkach, na ogół nie ma sposobu, aby oszacować transformację z jednej jednostki do drugiej.

Jeśli jednak wiedziałeś , że istnieje multiplikatywna zależność między nimi, i że szum w dwóch zestawach, jeśli pomiary wynosi zero- średnia normalna (z równymi wariancjami lub różnymi, ale znanymi wariancjami), możesz oszacować mnożnik $ k $ na podstawie maksymalnego prawdopodobieństwa.

Jeśli przyjmiesz powyższe założenia, możesz postępować w następujący sposób. Niech $ X_B $ będzie rzeczywistą wartością wielokrotnie mierzonej ilości w jednostkach $ B $. Wtedy $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ dots, n $ i $ L_ {Bj} = X_B + f_j $, $ j = 1, \ dots, m $.

$ e_i $ i $ f_j $ to normalne i.i.d., normalne zmienne losowe o średniej 0 i wariancji $ \ sigma ^ 2 $. Możesz zapisać log-prawdopodobieństwo danych jako

$$ L (data; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$

Powinieneś być w stanie zmaksymalizować tę ilość w przeliczeniu na $ k $ i $ X_B $, aby otrzymać transformację (i oszacowanie ilości).

W rzeczywistości, jeśli przejdziesz przez algebrę ustawiania pochodnych cząstkowych funkcji logarytmiczno-prawdopodobieństwa względem $ k $ i $ X_B $ do zera, powinieneś otrzymać wyrażenie na $ k $, które masz w swoim pytaniu.

$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ i $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

Odpowiedź

Kluczowym dokumentem, którego potrzebujesz, jest GUM (Guide to the Uncertainty in Measurement) – JCGM 100: 2008 (GUM 1995 z drobnymi poprawkami) Bureau International de Poids et Mesures / guide / gum , które podaje pełne (międzynarodowe standardy) szczegółowe informacje o tym, jak ocenić skuteczność jednego pomiaru względem odniesienie (odniesienie będzie już miało możliwą do oszacowania niepewność). Dokumenty NIST USA również opierają się bezpośrednio na tym.

GUM umożliwia dokonanie wyboru metody oceny, ale następnie wymaga podania składnika błędu dla wszelkich założeń, takich jak przekonanie, że te dwa instrumenty nie mają przesunięcia.

Będziesz mieć zarówno terminy systematyczne, jak i przypadkowe. Systematyczne terminy są zwykle większym błędem i są często niedoceniane (spójrz na szacunki prędkości światła z początku XX wieku i ich słupki błędów – które się nie nakładały!).

Ponieważ ty mają tylko jedną część odniesienia, jedyne, co możesz zrobić, to jak dotąd ocenić względne rozmiary dwóch przypadkowych błędów pomiaru (w tym lokalne systematyczne zmiany, takie jak temperatura, operator, pora dnia ..)

Na koniec możesz podać błąd i współczynnik pokrycia dla nowych odczytów w pewnym zakresie ważności.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *