Ich habe zwei verschiedene Messinstrumente, A und B, die beide dieselbe physikalische Größe messen, jedoch unterschiedliche Maßeinheiten haben: $ u_A $ und $ u_B $.

A ist ein Referenzinstrument.

Ich habe einen Referenzteil $ L $ $ n $ mal mit A gemessen und erhalte die $ n $ -Werte $ L_ { Ai} $ ($ i = 1 \ dots n $) ausgedrückt als Maßeinheit $ u_A $.

Dann messe ich den gleichen Referenzteil, $ L $, $ m $ mal mit B. und ich erhalte die $ m $ -Werte $ L_ {Bj} $ ($ j = 1 \ dots m $), ausgedrückt als Maßeinheit $ u_B $.

In Zukunft werde ich meine machen Kennzahlen mit B, aber ich werde an der Kennzahl interessiert sein, die als Maßeinheit $ u_A $ ausgedrückt wird.

Ich gehe davon aus, dass ich $ u_B $ mit nur einem multiplikativen Umrechnungsfaktor in $ u_A $ umwandeln kann $ k $.

Nun habe ich drei Fragen:

  1. Ist es möglich, die Gültigkeit der obigen Annahme ausgehend von den Werten $ L_ {Ai zu bewerten } $ und $ L_ {Bj} $?

  2. Wenn die Annahme gültig ist, wie kann ich den Umrechnungsfaktor $ k $ berechnen, um das Maß von $ u_B $ in $ u_A $ umzuwandeln, dh $ L_A = k L_B $?

  3. Wie man den Fall verwaltet, in dem ich mehr als einen Teil habe, dh $ L_1 $, $ L_2 $ usw.

Mein erster Versuch ist anzunehmen die Annahme als gültig und dann $ k $ als $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $ berechnen, aber es basiert mehr auf “ gesunder Menschenverstand „anstatt auf einer angemessenen statistischen Basis.

Können Sie mir einige Hinweise zu dem Teil der Statistik geben, der diese Art von Problem abdeckt? Vielleicht lineare Regression?

Kommentare

  • Ihre Methode (auf der Suche nach “ einem multiplikativen Umrechnungsfaktor „) würde zwischen Fahrenheit und Celsius nicht funktionieren.
  • @Henry Ja, ich weiß, aus diesem Grund habe ich die Frage Nr. 1 gestellt.
  • Wollen Sie uns sagen, dass Sie wissen, dass dieselbe physikalische Größe in verschiedenen Einheiten gemessen wird, aber Sie nicht wissen, wie die Einheiten umgerechnet werden?
  • @cbeleites Ja.
  • Aber Sie Kennen Sie die Einheiten?

Antwort

Basierend auf Ihren Kommentaren möchten Sie eine Kalibrierung , die Sie auch validieren möchten :

Sie haben

  • Referenzmessungen einer Temperatur ( Thermometer A) und
  • Messungen von Instrument B, das noch kein Thermometer ist, da Sie keine Antwort erhalten der physikalischen Quantitätstemperaturen, aber einer physikalischen Größe wie z.B. Elektronen / s.
    Das Auslesen der Kamera entspricht nicht der physikalischen Größe einer Temperatur.

Ihre Aufgabe besteht also darin, die Umwandlung zwischen Elektronen / s und Temperatur zu ermitteln, d. h Kalibrieren Sie Ihre Kameraausgabe auf Temperaturen.

Ich bin Chemiker und mache Kalibrierungen, um die Instrumentenanzeige mit chemischen Größen in Beziehung zu setzen. Es gibt ganze Bücher zum Thema, wie Sie ein gutes Kalibrierungsmodell erhalten (Ihre Frage 2) ) und dann, wie diese Methode validiert wird (Ihre Frage 1).

Also:

Frage 1: Wie berechnet man den Parameter $ k $ ?

Dies wird als Anpassen des Kalibrierungsmodells bezeichnet.

Und dieser Teil beginnt tatsächlich mit der Entscheidung, welche Art von Modell geeignet ist. Dies ist Ihre Annahme (multiplikativ). ist.

In der Chemometrie werden manchmal die Begriffe weiche und harte Modelle verwendet, um zu unterscheiden:

  • harte Modelle: Ableiten des Ansatzes für das Modell aus ersten (globalen) Prinzipien ,
    zB beschreiben g Kameraanzeige als Funktion der Temperatur (z. Schwarzkörperstrahlung, Quanteneffizienz der Kamera bei verschiedenen Wellenlängen, …) und dann Auflösen nach Temperatur und Vereinfachung so weit wie möglich, indem so viele Parameter wie möglich zu weniger Parametern zusammengeführt werden, die experimentell bestimmt werden müssen.
  • eiche Modelle: Modellierung der Kalibrierungsfunktion durch Näherungen, die unabhängig von der genauen physikalischen Verbindung sind.
    ZB Sie können davon ausgehen, dass Sie, wenn Ihr Temperaturbereich eng genug ist, den unbekannten harten Ansatz durch ein lineares Modell approximieren können. Wenn dies nicht ausreicht, kann ein Quadrat angemessen sein usw. Oder Sie erwarten ein Sigmoid-Verhalten usw.

Empfehlung 1: Denken Sie ein wenig nach und entscheiden Sie ungefähr, welche Art von Beziehung Sie erwarten.

Weiche Modellierung ist eine gültige und weit verbreitete Option, die Sie jedoch geben sollten Begründung, warum eine multiplikative Beziehung im Vergleich zu anderen Funktionsfamilien wie Sigmoid oder Exponential oder Logarithmus sinnvoll ist.

Frage 3: Was tun mit mehr $ L $ span? > s?

Ich bin nicht sicher, ob ich richtig verstehe, was die verschiedenen $ L $ sind.

  • Wenn es sich um Messungen von Teilen mit einer anderen Temperatur handelt, benötigen Sie diese, wie Peter Flom und Gung bereits sagten.
    Normalerweise wird eine Extrapolation außerhalb des kalibrierten Bereichs (dh der Temperaturbereich, der von Ihren Modellanpassungsdaten überspannt wird) als nicht gültig angesehen . Sie können für eine Ausnahme argumentieren, wenn Sie die Methode für einen größeren Bereich validieren (siehe unten). Wenn Sie jedoch eine Vielzahl von Validierungsdaten erhalten können, gibt es keinen Grund, warum Sie auch für diesen Bereich keine Trainingsdaten erhalten könnten.

  • , wenn Sie sich auf die Kamera beziehen mit vielen Pixeln: Es hängt von den Eigenschaften der Kamera ab, ob Sie davon ausgehen können, dass alle Pixel der gleichen Kalibrierung folgen, oder ob Sie jedes Pixel kalibrieren müssen.

Frage 1: Wie kann man wissen, ob eine multiplikative Beziehung angemessen ist? Teil I

In der Chemometrie wird eine multiplikative Beziehung ohne Abfangen nicht einmal in Situationen durchgeführt, in denen das harte Modell eine nur multiplikative Beziehung vorschlägt (z. B. Beer-Lambert-Gesetz) als Es gibt normalerweise viele Dinge bei der Konstruktion von Instrumenten, die zu einem Abfangen führen.
Meine Erfahrung legt nahe, dass eine multiplikative Beziehung ohne Abfangbegriff für das Auslesen der Kamera kaum geeignet ist.
ZB alle Kameraauslesungen I “ Wir haben bisher mit einer Vorspannung oder einem Dunkelstrom gearbeitet, was ein Schnittpunkt im Modell wäre.

Empfehlung 2: Wenn Sie sich für ein multiplikatives Modell ohne Intercept entscheiden, sollten Sie in der Lage sein, sehr viel zu geben gute Gründe, warum möglicherweise kein Abfangen auftreten kann. Umgekehrt kann dies einfacher sein: Versuchen Sie, Situationen zu erfinden, die zu einem Abfangen der Kameraauslesung führen würden. Wenn Sie einen Achsenabschnitt erstellen können, sollten Sie einen in das Modell aufnehmen.

Die sogenannte Regressionsdiagnose für lineare Modelle zeigt an, ob der Achsenabschnitt nicht von Null unterschieden werden kann . Dies wäre ein Beweis dafür, dass Sie ein Modell ohne Unterbrechung anpassen können. Ebenso können Sie ein quadratisches Modell anpassen und prüfen, ob der quadratische Term von Null unterschieden werden kann.

Frage 1: Woher wissen, ob eine multiplikative Beziehung angemessen ist? Teil II

Während Sie innerhalb der zum Erstellen des Kalibrierungsmodells verwendeten Messreihe bestimmte Fehler feststellen können, ist “ gültig “ bedeutet mehr als das. In der Regel bedeutet dies den Nachweis, dass Ihre Kalibrierung erfolgreich auf das Auslesen völlig unbekannter Proben durch die Kamera angewendet werden kann (möglicherweise einige Zeit nach der Kalibrierung gemessen). Wieder gibt es eine ganze Reihe von Literatur zur Validierung , und je nachdem, was Ihr genaues Feld ist, gibt es auch Normen, die Sie haben sollte folgen.

Kurz gesagt, für die Validierung benötigen Sie einen zweiten Satz von Messungen, die in keiner Weise an der Erstellung der Kalibrierung beteiligt waren. Anschließend vergleichen Sie die Ausgabe des Referenzinstruments mit den Vorhersagen der Kalibrierung. Wenn Sie die Abweichungen betrachten, können Sie verschiedene Aspekte der Richtigkeit Ihrer Kalibrierung bewerten:

  • Bias (dh Ihr Modell verfügt über eine Systematik Abweichung)
  • Varianz (zufällige Unsicherheit)
  • Drift (dh $ k $ ändert sich im Laufe der Zeit; erfordert eine angemessene Planung der Messungen )

Einige Literatur

Kommentare

  • Vielen Dank. Haben Sie Vorschläge für ein gutes Online-Tutorial oder ein Buch?
  • @uvts_cvs: Ich habe einige Links zur Literatur hinzugefügt. Die letzteren 2 sind Zeitschriftenartikel, die möglicherweise hinter einer Pay-Wall für Sie stehen. Außerdem kann ich Ihnen einige Bücher in deutscher Sprache empfehlen.

Antwort

Wenn Sie die weniger restriktive Annahme treffen, dass die beiden Messungen durch eine lineare Gleichung zusammenhängen, dann : Für Frage 1 können Sie die Annahme mithilfe der linearen Regression bewerten. Wenn es gültig ist, sollte der Achsenabschnitt 0 sein (oder sehr nahe bei 0, wenn ein Messfehler vorliegt).

Bei Frage 2 gibt der Koeffizient die Konstante an, die verwendet werden soll

Bei Frage 3 bin ich mir nicht sicher, aber mehrere mehrfache Regressionen sollten zu sehr ähnlichen Ergebnissen führen, es sei denn, es liegt ein großer Messfehler vor.

ZB für Fahrenheit und Celsius:

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

und zumindest mit diesem Startwert liegen die Ergebnisse ziemlich nahe.

Vorausgesetzt, Sie haben Bei mehr als drei Messungen mit jedem Instrument können Sie die anfängliche Annahme beurteilen, indem Sie ein Streudiagramm der beiden Messungen zeichnen und dann eine glatte Kurve wie Löss oder Splines verwenden. Wenn die Annahme richtig ist, ist die glatte Kurve nahezu gerade.

Kommentare

  • Vielen Dank. Ihr Codebeispiel ist sinnvoll, da Sie drei verschiedene Werte für LAbase verwenden. Mein Fall ähnelt eher LAbase <- c(10, 10, 10) wobei L=10 und n=3 und in diesem Fall ist das berechnete Modell m1 für mich nicht von Bedeutung.
  • Wenn Sie für LAbase immer die gleichen Werte erhalten, können Sie nichts tun.

Antwort

  1. Ihre Annahme, dass sich die Maße nur durch eine multiplikative Konstante unterscheiden, erscheint mir mit Sicherheit falsch. Die Tatsache, dass dies bei der Umrechnung von Fahrenheit in Celsius nicht funktionieren würde, zeigt dies.
  2. (A.k.a. # 3) Sie müssen mehr als einen Teil bewerten. Sie haben nicht genügend Freiheitsgrade, um die Umrechnung zwischen den beiden Messungen zu bestimmen, wenn Sie nur ein Teil verwenden. Versuchen Sie außerdem, Teile zu erhalten, bei denen die wahren Werte der Messungen einen möglichst großen Bereich umfassen, und zwar den Bereich, in dem Sie die Konvertierung in Zukunft durchführen möchten.
  3. (A.k.a. # 2) Sie können die Umrechnungsgleichung mittels einer Regressionsanalyse bestimmen. Mit mehreren Maßnahmen könnten Sie ein mehrstufiges Modell verwenden, aber ich vermute, dass dies mehr als notwendig ist. Wenn Sie mit jedem Messgerät mehrere Messungen für jedes Teil durchführen, können Sie einfach die von Ihnen beschriebenen Durchschnittswerte verwenden, um eine robustere Messung zu erhalten. Dann können Sie diese beiden Mittel einfach als Ihre $ x $ – und $ y $ -Werte für diesen Teil verwenden. Die Beta-Schätzungen aus der Regressionsgleichung geben Ihnen die erforderliche Verschiebung.

    Beachten Sie, dass dies nicht die gleichen Werte sind, die Sie mit anderen Konvertierungsstrategien erhalten könnten, da sich die Vorgehensweise unterscheidet. Wenn Sie beispielsweise von Fahrenheit in Celsius konvertieren, können Sie 32 subtrahieren und durch 1,8 dividieren , aber um eine Regressionsgleichung zu verwenden, $ \ beta_0 \ ca. 18 $ und $ \ beta_1 \ ca. 6 $. Dies spielt keine Rolle, solange Sie wissen, welche Prozedur Sie verwenden.

    Eine andere Der Vorteil des Regressionsansatzes besteht übrigens darin, dass die Konvertierung zwischen zwei Messinstrumenten nicht unbedingt über den möglichen Bereich linear ist, was eine Regressionsanalyse möglicherweise zur Modellierung ermöglicht.

Antwort

Wenn Sie mehrere Messungen desselben haben Menge mehrmals in den beiden Einheiten gibt es im Allgemeinen keine Möglichkeit, die Transformation von einer Einheit zur anderen abzuschätzen.

Wenn Sie jedoch wussten , dass es eine multiplikative Beziehung zwischen den beiden gibt, und , dass das Rauschen in den beiden Sätzen, wenn die Messungen Null sind, Mittelwert normal (mit gleichen Abweichungen oder unterschiedlichen, aber bekannten Abweichungen), dann können Sie den multiplikativen Faktor $ k $ anhand der maximalen Wahrscheinlichkeit schätzen.

Wenn Sie die obigen Annahmen treffen, können Sie wie folgt vorgehen. Sei $ X_B $ der tatsächliche Wert der Menge, die Sie wiederholt in Einheiten von $ B $ messen. Dann ist $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ Punkte, n $ und $ L_ {Bj} = X_B + f_j $, $ j = 1, \ Punkte, m $.

$ e_i $ und $ f_j $ sind normale i.i.d., normale Zufallsvariablen mit Mittelwert 0 und Varianz $ \ sigma ^ 2 $. Sie können die Log-Wahrscheinlichkeit der Daten schreiben als

$$ L (Daten; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$

Sie sollten in der Lage sein, diese Menge in $ zu maximieren k $ und $ X_B $, um Ihre Transformation (und eine Schätzung der Menge) zu erhalten.

Wenn Sie die Algebra zum Setzen der partiellen Ableitungen der Log-Likelihood-Funktion in Bezug auf $ durchlaufen k $ und $ X_B $ auf Null, sollten Sie den Ausdruck für $ k $ erhalten, den Sie in Ihrer Frage haben.

$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ und $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

Antwort

Das wichtigste Dokument, das Sie benötigen, ist das GUM (Leitfaden zur Messunsicherheit) – JCGM 100: 2008 (GUM 1995) mit geringfügigen Korrekturen) Internationales Büro für Poids et Mesures / Guides / Gummi , das die vollständigen (internationalen Standard-) Details zur Bewertung der Leistung einer Maßnahme anhand von a enthält Referenz (Ihre Referenz hat bereits eine bewertbare Unsicherheit). Die US-NIST-Dokumente basieren ebenfalls direkt darauf.

Mit dem GUM können Sie Ihre Wahl bezüglich der Bewertungsmethode treffen, müssen dann jedoch einen Fehlerbegriff für alle Annahmen angeben, z. B. die Annahme, dass die beiden Instrumente haben keinen Versatz.

Sie haben sowohl systematische als auch zufällige Begriffe. Die systematischen Begriffe sind normalerweise der größere Fehler und werden häufig unterbewertet (siehe die Schätzungen des frühen 20. Jahrhunderts für die Lichtgeschwindigkeit und ihre Fehlerbalken – die sich nicht überlappten!).

Weil Sie Sie haben bisher nur einen Referenzteil. Sie können lediglich die relativen Größen der beiden zufälligen Messfehler (einschließlich lokaler systematischer Abweichungen wie Temperatur, Bediener, Tageszeit) bewerten.

Am Ende können Sie einen Fehler und einen Abdeckungsfaktor für Ihre neuen Messwerte über einen bestimmten Gültigkeitsbereich angeben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.