2つの異なる測定機器AとBがあり、どちらも同じ物理量を測定しますが、測定単位は異なります:$ u_A $
Aは参照機器です。
Aを使用して参照部品を$ L $ $ n $回測定し、$ n $の値を取得しました$ L_ { Ai} $($ i = 1 \ dots n $)は、測定単位$ u_A $で表されます。
次に、同じ参照部分$ L $、$ m $をBで測定します。そして、測定単位$ u_B $で表された$ m $値$ L_ {Bj} $($ j = 1 \ dots m $)を取得します。
将来的にはBで測定しますが、測定単位$ u_A $で表される測定に興味があります。
1つの乗法変換係数だけで$ u_B $を$ u_A $に変換できると思います。 $ k $。
ここで、3つの質問があります。
-
値$ L_ {Aiから始めて、上記の仮定の妥当性を評価することは可能ですか。 } $と$ L_ {Bj} $?
-
仮定が有効な場合、変換係数$ k $を計算して、メジャーを$ u_B $から$ u_A $に変換するにはどうすればよいですか?つまり、$ L_A = k L_B $?
-
$ L_1 $、$ L_2 $など、複数のパーツがある場合の管理方法
最初の試みは、仮定は有効であり、$ k $を$ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $として計算しますが、これは「
この種の問題をカバーする統計の部分について、いくつかのヒントを教えてください。線形回帰かもしれませんか?
コメント
- あなたの方法(” 1つの乗法変換係数を探します”)は、華氏と摂氏の間では機能しません。
- @Henryはい、そのため、質問番号1を尋ねました。
- 同じ物理量が異なる単位で測定されていることはわかっているが、単位がどのように変換されるかわからないということですか?
- @cbeleitesはい。
- しかし、そうですか?単位を知っていますか?
回答
コメントに基づいて、やりたいことはキャリブレーション、これも検証:
あなたは
- 温度の参照測定値(温度計 A)、および
- の測定値を持っています応答がないため、まだ温度計ではない機器 B物理量の温度ですが、例えばのような物理量の電子/秒。
カメラの読み取り値は温度と同じ物理量ではありません。
したがって、実際のタスクは、電子/秒と温度の間の変換を見つけることです。カメラの出力を温度に合わせて校正します。
私は化学者です。機器の読み取り値を化学物質の量に関連付けるための校正を行います。適切な校正モデルを取得する方法について書かれた本があります(質問2 )次に、このメソッドを検証する方法(質問1)。
つまり:
質問1:パラメーター $ kを計算する方法$ ?
これはキャリブレーションモデルのフィッティングと呼ばれます。
そしてこの部分は、実際にはどの種類のモデルが適切かを決定することから始まります。これがあなたの仮定(乗法)です。
ケモメトリックスでは、ソフトモデルとハードモデルという用語を区別するために使用されることがあります。
- ハードモデル:モデルのアンサッツを最初の(グローバル)原則から導き出す、
例:説明g温度の関数としてのカメラの読み取り(例:黒体放射、さまざまな波長でのカメラの量子効率、…)次に、温度を解き、実験的に決定する必要のあるより少ないパラメータにできるだけ多くのパラメータをマージすることにより、可能な限り単純化します。 - ソフトモデル:正確な物理的接続に依存しない近似によるキャリブレーション関数のモデリング。
例:温度範囲が十分に狭い場合は、線形モデルによって未知のハード仮説を近似できると考えるかもしれません。それでも不十分な場合は、2次式などが適切な場合があります。または、シグモイド動作などが予想される場合もあります。
推奨事項1:少し考えて、予想される関係のタイプを大まかに決定します。
ソフトモデリングは有効で広く使用されているオプションですが、次のことができるはずです。シグモイド関数、指数関数、対数関数などの他の関数ファミリーと比較して、乗法関係が賢明である理由を説明します。
質問3:より多くの $ L $ spanをどうするか> s?
さまざまな
-
他の温度の部品の測定値である場合は、Peter Flomとgungがすでに述べたように、それらが必要になります。
通常、キャリブレーションされた範囲外の外挿(つまり、モデルフィッティングデータがまたがる温度範囲)は有効とは見なされません。より広い範囲でメソッドを検証する場合(以下を参照)、例外について議論することができます。ただし、広範囲の検証データを取得できる場合は、その範囲のトレーニングデータも取得できなかった理由はありません。 -
カメラを参照する場合ピクセル数が多い:すべてのピクセルが同じキャリブレーションに従うと合理的に想定できるかどうか、または各ピクセルをキャリブレーションする必要があるかどうかは、カメラのプロパティによって異なります。
質問1:乗法関係が適切かどうかを知る方法パートI
ケモメトリックスでは、ハードモデルが乗法のみの関係(ビール-ランバートの法則など)を示唆している状況でも、切片なしの乗法は実行されません。通常、インターセプトにつながる機器の構築には多くのことがあります。
私の経験では、インターセプト項のない乗法関係は、カメラの読み取りにはほとんど適切ではありません。
例:すべてのカメラの読み取りI “これまでの作業では、モデルの切片となるバイアスまたは暗電流がありました。 / p>
推奨事項2:切片のない乗法モデルを決定した場合、非常にインターセプトが発生しない可能性がある正当な理由。これは逆の方が簡単かもしれません。カメラの読み取りの傍受につながる状況を発明してみてください。切片を思い付くことができる場合は、モデルに切片を含める必要があります。
線形モデルのいわゆる回帰診断は、切片をゼロと区別できないかどうかを示します。 。これは、切片なしでモデルを適合させることができる証拠になります。同様に、2次モデルを近似して、2次項をゼロと区別できるかどうかを確認できます。
質問1:乗法関係が適切かどうかを知る方法は?パートII
キャリブレーションモデルの構築に使用される一連の測定値内で問題が発生していることを特定できますが、”有効”はそれ以上のものを意味します。通常、これは、キャリブレーションが完全に未知のサンプルのカメラ読み取りに正常に適用できることを示すことを意味します(おそらくキャリブレーションが行われた後しばらくして測定されます)。ここでも、検証に関する一連の文献があり、正確なフィールドが何であるかに応じて、あなたが
簡単に言うと、検証には、キャリブレーションの構築にまったく関与していない2番目の測定セットが必要です。次に、参照機器の出力をキャリブレーションの予測と比較します。偏差を確認すると、キャリブレーションの正確さのいくつかの側面を評価できます。
- バイアス(つまり、モデルに体系的なものがある)偏差)
- 分散(ランダムな不確実性)
- ドリフト(つまり、 $ k $ は時間の経過とともに変化します。測定の適切な計画が必要です。 )
いくつかの文献
- IUPACの推奨事項:分析化学におけるキャリブレーションのガイドライン。パートI.基本単一コンポーネントのキャリブレーション
これは標準のようなものです。 - アメリカ研究所には分析化学の統計”
ここには、ケーススタディを含む多くのものがあります - Richard G. Brereton:分析化学における多変量キャリブレーションの概要、アナリスト、2000年、 125、2125-2154。
は、単変量キャリブレーションもカバーしているようです。 - Esbensen、KH & Geladi、P。Principles of Proper Validation:Use and Abuse of Re-Sampling for Validation J. Chemometrics、John Wiley & Sons、Ltd.、2010、24 、168-187
は、検証サンプルを選択する際に留意する必要があることについての適切な議論を提供します。
コメント
- ありがとうございます。良いオンラインチュートリアルや本について何か提案はありますか?
- @uvts_cvs:文献へのリンクをいくつか追加しました。後者の2つは、ペイウォールの背後にある可能性のあるジャーナル論文です。それに加えて、ドイツ語の本をいくつかお勧めします。
回答
2つの測定値が何らかの線形方程式によって関連付けられているという制限の少ない仮定を行う場合は、 :質問1の場合、線形回帰を使用して仮定を評価できます。有効な場合、切片は0(または測定誤差がある場合は0に非常に近い)である必要があります。
質問2の場合、係数は使用する定数を示します
質問3についてはよくわかりませんが、測定誤差が多い場合を除いて、複数の回帰を実行すると、非常に類似した結果が得られるはずです。
例:華氏と摂氏の場合:
set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1)
そして、少なくともこのシードを使用すると、結果は非常に近くなります。
次のようになります。各機器で3回以上の測定を行う場合は、2つの測定の散布図を描画し、黄土やスプラインなどの滑らかな曲線を使用することで、最初の仮定を評価できます。仮定が正しければ、滑らかな曲線はほぼ直線になります。
コメント
- ありがとうございます。
LAbase
に3つの異なる値を使用するため、コードサンプルは意味があります。私の場合は、LAbase <- c(10, 10, 10)
のようになります。L=10
とn=3
、その場合、計算されたモデルm1
は私には意味がありません。 - LAbaseで常に同じ値を取得する場合、何もする方法はありません。
回答
- 測定値が乗法定数によってのみ異なるというあなたの仮定は、確かに間違っていると私は思います。これが華氏から摂氏への変換では機能しないという事実は、それを示しています。
- (A.k.a。#3)複数の部分を評価する必要があります。 1つのパーツのみを使用する場合、2つの測定値間の変換を決定するのに十分な自由度がありません。さらに、測定値の真の値が可能な限り広い範囲に及ぶパーツを取得するようにしてください。また、将来的に変換を行う範囲に確実にまたがるようにしてください。
-
(A.k.a.#2)回帰分析を使用して変換式を決定できます。複数のメジャーを使用すると、マルチレベルモデルを使用できますが、これは必要以上のものだと思います。各測定器で各部品の複数の測定を行う場合は、説明したように平均を使用するだけで、より堅牢な測定を行うことができます。次に、これら2つの平均を、その部分の$ x $値と$ y $値として使用できます。回帰方程式からのベータ推定値は、必要なシフトを提供します。
ただし、手順が異なるため、これらは他の変換戦略で取得できる値と同じではないことに注意してください。たとえば、華氏から摂氏に変換するには、32を減算して1.8で除算できます。 、ただし、回帰方程式を使用するには、$ \ beta_0 \ approx18 $および$ \ beta_1 \ upperx.6 $です。使用している手順がわかっている限り、これは問題ではありません。
別のちなみに、回帰アプローチの利点は、2つの測定機器間の変換が、可能な範囲全体で必ずしも線形であるとは限らないことです。これにより、回帰分析でモデル化できる場合があります。
回答
同じ の測定値が複数ある場合2つのユニットで数回の量であるため、一般に、1つのユニットから別のユニットへの変換を推定する方法はありません。
ただし、2つの間に乗法的関係があることを知っている場合、測定値がゼロの場合、2つのセットのノイズは -平均正規(分散が等しいか、分散は異なるが既知の分散)の場合、最尤法で乗法係数$ k $を推定できます。
上記の仮定を行うと、次のように進めることができます。 $ X_B $を、$ B $の単位で繰り返し測定する数量の実際の値とします。次に、$ L_ {Ai} = k X_B + e_i $、$ i = 1、\ dots、n $、および$ L_ {Bj} = X_B + f_j $、$ j = 1、\ dots、m $。
$ e_i $と$ f_j $は正規分布であり、平均が0で分散が$ \ sigma ^ 2 $の正規確率変数です。データの対数尤度は、次のように記述できます。
$$ L(data; k、X_B)= const- \ frac {1} {\ sigma ^ 2} \ sum_i(L_ {Ai}- k X_B)^ 2- \ frac {1} {\ sigma ^ 2} \ sum_i(L_ {Bi} -X_B)^ 2 $$
この量を$で最大化できるはずですk $と$ X_B $を使用して、変換(および量の推定値)を取得します。
実際、$に関する対数尤度関数の部分導関数を設定する代数を実行する場合k $と$ X_B $をゼロにすると、質問にある$ k $の式を取得する必要があります。
$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $および$ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $
回答
必要な重要なドキュメントはGUM(測定の不確かさのガイド)-JCGM 100:2008(GUM 1995マイナーな修正あり) Bureau International de Poids et Mesures / guides / gum は、1つのメジャーのパフォーマンスを評価する方法に関する完全な(国際標準)詳細を提供します。参照(参照にはすでに評価可能な不確実性があります)。米国のNIST文書も、これに直接基づいています。
GUMを使用すると、評価方法を選択できますが、2つであるという信念など、仮定には誤差項を指定する必要があります。楽器にはオフセットがありません。
体系的な用語とランダムな用語の両方があります。体系的な用語は通常、より大きな誤差であり、一般的に過小評価されています(1900年初頭の光速とそのエラーバーの推定値を見てください。これは重複していませんでした!)。
あなたが参照部分は1つだけです。これまでのところ、2つのランダムな測定誤差(温度、オペレーター、時刻などの局所的な系統的変動を含む)の相対的なサイズを評価するだけです。
最後に、ある範囲の有効性にわたって、新しい測定値のエラーとカバレッジファクターを示すことができます。