Jai deux instruments de mesure différents, A et B, tous deux mesurant la même quantité physique mais avec des unités de mesure différentes: $ u_A $ et $ u_B $.

A est un instrument de référence.

Jai mesuré une pièce de référence $ L $ $ n $ fois avec A et jobtiens les $ n $ valeurs $ L_ { Ai} $ ($ i = 1 \ dots n $) exprimé en terme de lunité de mesure $ u_A $.

Ensuite, je mesure la même pièce de référence, $ L $, $ m $ fois avec B et jobtiens les valeurs $ m $ $ L_ {Bj} $ ($ j = 1 \ points m $) exprimées en terme dunité de mesure $ u_B $.

Dans le futur, je ferai mon mesures avec B mais je serai intéressé par la mesure exprimée en terme dunité de mesure $ u_A $.

Je suppose que je peux convertir $ u_B $ en $ u_A $ au moyen dun seul facteur de conversion multiplicatif $ k $.

Maintenant, jai trois questions:

  1. Est-il possible dévaluer la validité de lhypothèse ci-dessus à partir des valeurs $ L_ {Ai } $ et $ L_ {Bj} $?

  2. Si lhypothèse est valide, comment puis-je calculer le facteur de conversion $ k $ pour convertir la mesure de $ u_B $ en $ u_A $, soit $ L_A = k L_B $?

  3. Comment gérer le cas où jai plus dune partie, ie $ L_1 $, $ L_2 $, etc.

Ma première tentative est de supposer lhypothèse est valide, puis calculons $ k $ comme $ k = \ frac {m \ sum_ {i = 1} ^ n LA_i} {n \ sum_ {j = 1} ^ m LB_i} $ mais il est davantage basé sur  » le bon sens « plutôt que sur une base statistique appropriée.

Pouvez-vous me donner quelques indications sur la partie des statistiques qui couvre ce genre de problème? Peut-être une régression linéaire?

Commentaires

  • Votre méthode (à la recherche de  » un facteur de conversion multiplicatif « ) ne fonctionnerait pas entre Fahrenheit et Celsius.
  • @Henry Oui je sais, cest pour cette raison que jai posé la question numéro 1.
  • Êtes-vous en train de nous dire que vous savez que la même quantité physique est mesurée dans différentes unités mais que vous ne savez pas comment les unités sont converties?
  • @cbeleites Oui.
  • Mais le savez-vous? Connaissez-vous les unités?

Réponse

En fonction de vos commentaires, ce que vous voulez faire est un calibration , que vous souhaitez également valider :

vous avez

  • des mesures de référence dune température ( thermomètre A), et
  • des mesures de instrument B qui nest pas encore un thermomètre, car vous nobtenez pas de réponse des températures de la quantité physique mais dune quantité physique comme par ex. électrons / s.
    La lecture de la caméra n’est pas la même quantité physique qu’une température.

Donc, en fait, votre tâche est de trouver la conversion entre les électrons / s et la température, cest-à-dire étalonnez la sortie de votre caméra aux températures.

Je suis chimiométrique, je fais des étalonnages pour relier la lecture des instruments aux quantités chimiques. Il y a des livres entiers écrits sur la manière dobtenir un bon modèle détalonnage (votre question 2 ) puis comment valider cette méthode (votre question 1).

Donc:

Question 1: comment calculer le paramètre $ k $ ?

Cest ce quon appelle lajustement du modèle détalonnage.

Et cette partie commence en fait par décider quel type de modèle est approprié. Cest ce que vous supposez (multiplicatif) est.

En chimiométrie, les termes modèles souples et durs sont parfois utilisés pour distinguer:

  • modèles durs: dériver lansatz du modèle à partir des premiers principes (globaux) ,
    par exemple décrire g lecture de la caméra en fonction de la température (par ex. rayonnement du corps noir, efficacité quantique de la caméra à différentes longueurs donde, …) puis résolution de la température et simplification autant que possible en fusionnant autant de paramètres que possible en moins de paramètres à déterminer expérimentalement.
  • modèles souples: modéliser la fonction détalonnage par des approximations indépendantes de la connexion physique exacte.
    Par exemple vous pouvez supposer que si votre plage de température est suffisamment étroite, vous pouvez approximer lansatz dur inconnu par un modèle linéaire. Si cela ne suffit pas, le quadratique peut être approprié, etc. Ou, vous pouvez vous attendre à un comportement sigmoïde, etc.

Recommandation 1: réfléchissez un peu et décidez à peu près du type de relation que vous attendez.

La modélisation douce est une option valide et largement utilisée, mais vous devriez être en mesure de donner raisonner pourquoi la relation multiplicative est sensée par rapport à dautres familles de fonctions comme sigmoïde, exponentielle ou logarithmique.

Question 3: Que faire avec plus $ L $ s?

Je ne sais pas si je comprends bien ce que sont les différents $ L $ .

  • si ce sont des mesures de pièces avec une autre température, vous en aurez besoin comme Peter Flom et Gung lont déjà dit.
    Habituellement, lextrapolation en dehors de la plage étalonnée (cest-à-dire la plage de température couverte par les données dajustement de votre modèle) nest pas considérée comme valide . Vous pouvez plaider pour une exception si vous validez (voir ci-dessous) la méthode pour une gamme plus large; mais si vous pouvez obtenir un large éventail de données de validation, il ny a aucune raison pour que vous ne puissiez pas obtenir de données dentraînement pour cette plage également.

  • si vous faites référence à la caméra ayant de nombreux pixels: cela dépendra des propriétés de la caméra si vous pouvez raisonnablement supposer que tous les pixels suivent le même calibrage ou si vous devez calibrer chaque pixel.

Question 1: Comment savoir si la relation multiplicative est appropriée? Partie I

En chimiométrie, la multiplication sans interception nest même pas effectuée dans les situations où le modèle dur suggère une relation multiplicative uniquement (par exemple loi de Beer-Lambert) comme il y a généralement beaucoup de choses dans la construction dinstruments qui mènent à une interception.
Mon expérience suggère quune relation multiplicative sans terme dinterception nest pratiquement jamais appropriée pour la lecture de la caméra.
Par exemple toutes les lectures de caméra I  » Jai travaillé avec jusquà présent avait un biais ou un courant dobscurité qui serait une interception dans le modèle.

Recommandation 2: si vous optez pour un modèle multiplicatif sans interception, vous devriez pouvoir donner très bonnes raisons pour lesquelles aucune interception ne peut se produire. Cela peut être plus facile dans lautre sens: essayez dinventer des situations qui conduiraient à une interception pour la lecture de la caméra. Si vous pouvez trouver une interception, vous devez en inclure une dans le modèle.

Les soi-disant diagnostics de régression pour les modèles linéaires vous diront si l’interception ne peut pas être distinguée de zéro . Ce serait une preuve qui vous permet dajuster un modèle sans interception. De même, vous pouvez ajuster un modèle quadratique et voir si le terme quadratique peut être distingué de zéro.

Question 1: Comment savoir si la relation multiplicative est appropriée? Partie II

Bien que vous puissiez repérer certains problèmes dans l’ensemble de mesures utilisé pour construire le modèle d’étalonnage,  » valide  » signifie plus que cela. Habituellement, cela signifie démontrer que votre étalonnage peut être appliqué avec succès à la lecture par caméra déchantillons complètement inconnus (éventuellement mesurés quelque temps après létalonnage). Encore une fois, il existe toute une littérature à validation , et en fonction de votre champ exact, il existe également des normes selon lesquelles vous devrait suivre.

En bref, pour la validation, vous avez besoin dun deuxième ensemble de mesures qui na été impliqué daucune façon dans la construction de létalonnage. Vous comparez ensuite la sortie de linstrument de référence aux prédictions de létalonnage. En regardant les écarts, vous pouvez évaluer plusieurs aspects de lexactitude de votre étalonnage:

  • biais (cest-à-dire que votre modèle a un déviation)
  • variance (incertitude aléatoire)
  • dérive (c.-à-d. $ k $ change avec le temps; nécessite une planification appropriée des mesures )

Quelques documents

Commentaires

  • Merci beaucoup. Avez-vous des suggestions pour un bon tutoriel en ligne ou un livre?
  • @uvts_cvs: Jai ajouté des liens vers la littérature. Les 2 derniers sont des journaux qui peuvent être derrière un mur de paiement pour vous. En plus de cela, je pourrais vous recommander des livres en allemand.

Réponse

Si vous faites lhypothèse la moins restrictive que les deux mesures sont liées par une équation linéaire, alors : Pour la question 1, vous pouvez évaluer lhypothèse à laide de la régression linéaire. Sil est valide, lintersection doit être 0 (ou très proche de 0, sil y a une erreur de mesure).

Pour la question 2, le coefficient vous indiquera la constante à utiliser

Je ne suis pas sûr de la question 3, mais faire plusieurs régressions multiples devrait donner des résultats très similaires, sauf sil y a beaucoup derreur de mesure.

Par exemple pour Fahrenheit et Celsius:

set.seed(1919187321) LAbase <- c(0, 10, 20) LBbase <- LAbase*9/5 + 32 #Add error LA <- LAbase + rnorm(3) LB <- LBbase + rnorm(3) #regress m1 <- lm(LB~LA) summary(m1) 

et, avec cette graine au moins, les résultats sont assez proches.

Étant donné que vous aurez plus de trois mesures avec chaque instrument, vous pouvez évaluer lhypothèse initiale en dessinant un nuage de points des deux mesures, puis en utilisant une courbe lisse telle que des loess ou des splines. Si lhypothèse est correcte, la courbe lisse sera presque droite.

Commentaires

  • Merci. Votre exemple de code est significatif car vous utilisez trois valeurs différentes pour LAbase, mon cas ressemble plus à LAbase <- c(10, 10, 10)L=10 et n=3 et dans ce cas le modèle calculé m1 na pas de sens pour moi.
  • Si vous obtenez les mêmes valeurs tout le temps pour LAbase, il ny a aucun moyen de faire quoi que ce soit.

Réponse

  1. Votre hypothèse selon laquelle les mesures ne différeront que par une constante multiplicative me paraît certainement fausse. Le fait que cela ne fonctionnerait pas pour la conversion de Fahrenheit en Celsius le démontre.
  2. (A.k.a. # 3) Vous devrez évaluer plus dune partie. Vous naurez pas suffisamment de degrés de liberté pour déterminer la conversion entre les deux mesures si vous nutilisez quune seule pièce. De plus, essayez dobtenir des pièces où les vraies valeurs des mesures couvrent une plage aussi large que possible et couvrent certainement la plage dans laquelle vous voudrez effectuer la conversion à lavenir.
  3. (A.k.a. # 2) Vous pouvez déterminer léquation de conversion au moyen dune analyse de régression. Avec plusieurs mesures, vous pouvez utiliser un modèle à plusieurs niveaux, mais je suppose que cest plus que nécessaire. Si vous effectuez plusieurs mesures de chaque pièce avec chaque instrument de mesure, vous pouvez simplement utiliser les moyennes, comme vous le décrivez, pour obtenir une mesure plus robuste. Ensuite, vous pouvez simplement utiliser ces deux moyens comme valeurs $ x $ et $ y $ pour cette partie. Les estimations bêta de léquation de régression vous donneront le décalage requis.

    Notez que ces valeurs ne seront pas les mêmes que celles que vous pourriez obtenir via d’autres stratégies de conversion, car la procédure diffère; par exemple, pour convertir de Fahrenheit en Celsius, vous pouvez soustraire 32 et diviser par 1,8 , mais pour utiliser une équation de régression, $ \ beta_0 \ approx18 $ et $ \ beta_1 \ approx.6 $. Cela na pas dimportance, tant que vous savez quelle procédure vous utilisez.

    Autre Lavantage de lapproche de régression, en passant, est que la conversion entre deux instruments de mesure ne sera pas nécessairement linéaire sur toute la plage possible, quune analyse de régression peut vous permettre de modéliser.

Réponse

Si vous avez plusieurs mesures du même quantité plusieurs fois dans les deux unités, il ny a, en général, aucun moyen destimer la transformation dune unité à lautre.

Cependant, si vous saviez quil y a une relation multiplicative entre les deux, et que le bruit dans les deux ensembles si les mesures est nul- moyenne normale (avec des variances égales ou des variances différentes mais connues), vous pouvez alors estimer le facteur multiplicatif $ k $ par maximum de vraisemblance.

Si vous faites les hypothèses ci-dessus, vous pouvez procéder comme suit. Soit $ X_B $ la valeur réelle de la quantité que vous mesurez à plusieurs reprises en unités de $ B $. Alors $ L_ {Ai} = k X_B + e_i $, $ i = 1, \ dots, n $, et $ L_ {Bj} = X_B + f_j $, $ j = 1, \ dots, m $.

$ e_i $ et $ f_j $ sont des variables i.i.d. normales, aléatoires normales avec une moyenne de 0 et une variance $ \ sigma ^ 2 $. Vous pouvez écrire le log-vraisemblance des données comme

$$ L (data; k, X_B) = const – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Ai} – k X_B) ^ 2 – \ frac {1} {\ sigma ^ 2} \ sum_i (L_ {Bi} – X_B) ^ 2 $$

Vous devriez pouvoir maximiser cette quantité en termes de $ k $ et $ X_B $ pour obtenir votre transformation (et une estimation de la quantité).

En fait, si vous passez par lalgèbre de définition des dérivées partielles de la fonction log-vraisemblance par rapport à $ k $ et $ X_B $ à zéro, vous devriez obtenir lexpression pour $ k $ que vous avez dans votre question.

$ X_B = \ frac {\ sum_j L_ {Bj}} {m} $ et $ k = \ frac {m \ sum_i L_ {Ai}} {n \ sum_j L_ {Bj}} $

Réponse

Le document clé dont vous avez besoin est le GUM (Guide to the Uncertainty in Measurement) – JCGM 100: 2008 (GUM 1995 avec des corrections mineures) Bureau International de Poids et Mesures / guides / gum qui donne tous les détails (norme internationale) sur la façon d’évaluer la performance d’une mesure par rapport à une référence (votre référence aura déjà une incertitude évaluable). Les documents du NIST américain sont également basés directement sur cela.

Le GUM vous permet de faire votre choix sur la méthode dévaluation, mais vous oblige ensuite à fournir un terme derreur pour toute hypothèse, telle que la croyance que les deux les instruments nont pas de décalage.

Vous aurez à la fois des termes systématiques et des termes aléatoires. Les termes systématiques sont généralement la plus grande erreur et sont souvent sous-évalués (regardez les estimations du début des années 1900 pour la vitesse de la lumière et leurs barres derreur – qui ne se chevauchaient pas!).

Parce que vous nont quune seule partie de référence, tout ce que vous pouvez faire, pour linstant, est dévaluer les tailles relatives des deux erreurs aléatoires de mesure (y compris la variation systématique locale telle que la température, lopérateur, lheure de la journée ..)

À la fin, vous pourrez indiquer une erreur et un facteur de couverture pour vos nouvelles lectures sur une certaine plage de validité.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *