
Introduction aux statistiques
L’estimation de l’incertitude de mesure nécessite une bonne compréhension des statistiques et de l’analyse statistique. Bien qu’il existe de nombreuses ressources statistiques gratuites en ligne, personne n’a créé de guide statistique spécifiquement pour l’estimation de l’incertitude de mesure.
Dans cet article, j’ai compilé une liste complète des fonctions statistiques pour vous aider à calculer l’incertitude de mesure et à évaluer vos résultats. Ce guide vous apprendra la définition, l’équation et les instructions pour calculer chaque fonction statistique. De plus, j’ai inclus quelques principes et règles statistiques pour vous aider à évaluer vos résultats.
Contexte
Lorsque j’ai commencé à calculer l’incertitude, j’avais l’habitude de me référer constamment à plusieurs manuels universitaires pour trouver des fonctions statistiques permettant d’analyser des données. Certains de mes manuels de statistiques préférés ;
•Statistiques de l’ingénierie et des sciences par Mendenhall et Sincich
•Introduction au contrôle statistique de la qualité par Douglas Montgomery
•Statistiques pour les expérimentateurs par boîte, chasseur et chasseur
J’ai utilisé les manuels universitaires parce qu’ils étaient la seule ressource disponible pour évaluer les calculs d’incertitude de mesure.
Au fil des ans, j’ai tellement utilisé ces manuels que je connais maintenant ces fonctions par cœur. Par conséquent, j’ai pensé que ce serait une excellente idée de créer pour vous un guide d’introduction aux statistiques pour l’analyse de l’incertitude.
Chacune des fonctions statistiques énumérées dans ce guide a un objectif spécifique. Certaines fonctions sont utilisées pour estimer l’incertitude et d’autres sont utilisées pour évaluer les résultats.
Je crois que j’ai créé un excellent guide d’introduction aux statistiques pour calculer l’incertitude et évaluer vos résultats. Si j’ai oublié quelque chose, n’hésitez pas à recommander des fonctions supplémentaires.
Vous trouverez ci-dessous une liste des fonctions statistiques incluses dans ce guide. Il suffit de cliquer sur la fonction sur laquelle vous souhaitez en savoir plus.
Moyenne
Variance
Écart type
Détermination de la taille de l’échantillon
Degrés de liberté
Somme des carrés
Racine de la somme des carrés
Écart regroupé
Degrés de liberté effectifs
Interpolation linéaire
Régression linéaire
Coefficient de sensibilité
Covariance
Corrélation
Coefficient de corrélation (R)
Coefficient de détermination (R2)
Théorème central limite
Écart type de la moyenne
Intervalles de confiance
Score Z
T-Score
Distribution T de Student
Distributions de probabilité
Moyenne
Lorsque vous avez besoin de connaître la valeur centrale de votre échantillon de données, vous devez calculer la valeur moyenne ou moyenne. Il peut être utilisé pour prédire la valeur attendue des résultats de mesure futurs.
Définition
Le nombre central d’un ensemble de nombres qui est calculé en additionnant des quantités, puis en divisant le nombre total de quantités.
Équation

Comment calculer
1. Additionnez toutes les valeurs.
2. Comptez le nombre de valeurs.
3. Divisez l’étape 1 par l’étape 2.
Variance
Lorsque vous souhaitez connaître la répartition des données de votre ensemble d’échantillons, vous devez calculer la variance.
Définition
Mesure de l’écart entre les nombres d’un ensemble de données.
Équation

Comment calculer
1. Soustrayez chaque valeur par la moyenne.
2. Équerrez chaque valeur à l’étape 1.
3. Additionnez toutes les valeurs de l’étape 2.
Écart type
Lorsque vous analysez un ensemble de données et que vous avez besoin de connaître la variabilité aléatoire moyenne, vous souhaitez utiliser l’équation de l’écart-type. Il s’agit de l’une des fonctions statistiques descriptives les plus couramment utilisées pour calculer l’incertitude.
Définition
Mesure de la dispersion d’un ensemble de données par rapport à sa moyenne (c’est-à-dire la moyenne).
Équation

Comment calculer
1. Soustrayez chaque valeur de la moyenne.
2. Équerrez chaque valeur à l’étape 1.
3. Additionnez toutes les valeurs de l’étape 2.
4. Comptez le nombre de valeurs et soustrayez-le par 1.
5. Divisez l’étape 3 par l’étape 4.
6. Calculez la racine carrée de l’étape 5.
Détermination de la taille de l’échantillon
Avez-vous déjà voulu réduire l’amplitude de votre écart-type ? Eh bien, si vous savez à quel point vous voulez que l’écart-type soit petit, vous pouvez utiliser cette fonction pour vous dire combien d’échantillons vous devrez collecter pour atteindre votre objectif.
Définition
Le nombre d’échantillons requis pour obtenir une marge d’erreur souhaitée.
Équation

Comment calculer
1. Choisissez le niveau de confiance souhaité (z).
2. Choisissez la marge d’erreur souhaitée.
3. Multipliez le résultat de l’étape 1 par la valeur par l’écart-type de l’ensemble d’échantillons.
4. Divisez le résultat par la marge d’erreur sélectionnée à l’étape 2.
5. Équerrez le résultat calculé à l’étape 4.
Degrés de liberté
Lorsque vous souhaitez déterminer la signification d’estimations statistiques, telles que la moyenne, l’écart-type, etc., il est important de calculer les degrés de liberté. De plus, les degrés de liberté sont couramment utilisés pour estimer les intervalles de confiance.
Définition
Nombre de valeurs qui peuvent varier librement dans le calcul final d’une statistique.
Équation

Comment calculer
1. Comptez le nombre de valeurs dans le jeu d’échantillons.
2. Soustrayez la valeur de l’étape 1 par 1.
Somme des carrés
Lorsque vous avez besoin de connaître la variation totale attribuée par divers facteurs, la somme des carrés est une fonction importante à utiliser. Il est couramment utilisé dans l’analyse de régression pour évaluer l’erreur résiduelle d’un modèle.
Définition
La somme des erreurs quadratoires, des incertitudes et/ou des tolérances.
Équation

Comment calculer
1. Équerrez chaque valeur dans l’ensemble d’échantillons.
2. Additionnez toutes les valeurs de l’étape 1.
Racine de la somme des carrés
Vous avez besoin de calculer la variation totale de plusieurs influences non corrélées pour l’analyse d’incertitude, d’erreur ou de tolérance ? Ensuite, la méthode de la somme des carrés (i.e. RSS) doit être votre fonction statistique préférée.
Définition
La racine carrée de la somme des erreurs carrées, des incertitudes et/ou des tolérances.
Équation

Comment calculer
1. Équerrez chaque valeur dans l’ensemble d’échantillons.
2. Additionnez toutes les valeurs de l’étape 1.
3. Calculez la racine carrée de la valeur à l’étape 2.
Écart regroupé
Parfois, vous avez besoin de trouver la moyenne de plusieurs écarts-types calculés. Eh bien, vous ne pouvez pas approximer l’écart-type moyen en utilisant la fonction moyenne. C’est une erreur que je vois les gens faire tout le temps.
Au lieu de cela, vous devez utiliser la méthode de variance regroupée.
Définition
L’estimation de la variance pour plusieurs populations, chacune avec sa propre moyenne et son propre écart-type.
Équation

Comment calculer
1. Équerrez chaque valeur dans l’ensemble d’échantillons.
2. Multipliez chaque valeur de l’étape 1 par ses degrés de liberté.
3. Ajoutez toutes les valeurs de l’étape 2.
4. Additionnez tous les degrés de liberté.
5. Divisez la valeur de l’étape 3 par la valeur de l’étape 4.
6. Calculez la racine carrée de la valeur à l’étape 5.
Degrés de liberté effectifs
Vous voulez utiliser la distribution T de l’étudiant pour trouver votre facteur de couverture ? Utilisez l’équation de Welch-Satterthwaite pour approximer vos degrés de liberté effectifs.
Définition
Les degrés de liberté approximatifs d’une variable approximée par la distribution t.
Équation

Comment calculer
1. Calculez l’incertitude combinée élevée à la puissance 4.
2. Calculez le coefficient de sensibilité élevé à la puissance 4.
3. Calculez l’incertitude standard élevée à la puissance 4.
4. Multipliez les résultats de l’étape 2 et de l’étape 3.
5. Divisez les résultats de l’étape 4 par ses degrés de liberté associés.
6. Répétez les étapes 2 à 5 pour chaque coefficient de sensibilité et valeur d’incertitude standard.
7. Ajoutez tous les résultats de l’étape 5.
8. Divisez le résultat de l’étape 1 par le résultat de l’étape 7.
Interpolation linéaire
Vous voulez calculer des équations pour votre incertitude CMC ? Utilisez l’interpolation linéaire pour développer une équation de prédiction permettant d’estimer l’incertitude de mesure entre deux points d’une fonction de mesure.
Définition
L’estimation de nouveaux points de données dans une plage entre deux points de données connus.
Équation

Où

Comment calculer
1. Trouvez les points maximum et minimum connus pour x et y.
un. Attribuez la valeur maximale de y ày 2.
b. Attribuez la valeur minimale de y ày 1.
c. Attribuez la valeur maximale de x à x2.
d. Attribuez la valeur minimale de x à x1.
2. Calculez le coefficient de gain : B1
un. Soustrayez le résultat de y2 par le résultat de y1.
b. Soustrayez le résultat de x2 par le résultat de x1.
c. Divisez le résultat de l’étape 2a par le résultat de l’étape 2b.
3. Calculez le coefficient de décalage : B0
un. Multipliez le résultat de l’étape 2c par le résultat de x1.
b. Soustrayez la moyenne de y par le résultat calculé à l’étape 2a.
4. Vérifiez vos résultats.
Régression linéaire
Si vous avez besoin de trouver un modèle de prédiction pour votre incertitude CMC en utilisant plus de deux points de données, vous voudrez utiliser la régression linéaire pour trouver une équation linéaire plus précise.
Définition
Procédure d’estimation de la relation entre une variable dépendante (y) et une ou plusieurs variables indépendantes (x) pour une population donnée.
Équation

Où

Comment calculer
1. Calculez le coefficient de gain : B1
un. Calculez la moyenne (c’est-à-dire la moyenne) de x.
b. Calculez la moyenne (c’est-à-dire la moyenne) de y.
c. Soustrayez la valeur de x par la moyenne (c’est-à-dire la moyenne) de x.
d. Soustrayez la valeur de y par la moyenne (c’est-à-dire la moyenne) de y.
e. Multipliez le résultat de l’étape 1c par le résultat de l’étape 1d.
f. Répétez les étapes 1c à 1e pour chaque valeur de x et y dans le jeu d’échantillons.
g. Additionnez tous les résultats calculés à l’étape 1f.
h. Soustrayez la valeur de x par la moyenne (c’est-à-dire la moyenne) de x.
i. Mettez au carré le résultat de l’étape 1h.
j. Répétez les étapes 1h et 1i pour chaque valeur de x dans le jeu d’échantillons.
k. Additionnez tous les résultats calculés à l’étape 1j.
l. Divisez le résultat de l’étape 1g par le résultat de l’étape 1k.
2. Calculez le coefficient de décalage : B0
un. Multipliez le résultat de l’étape 1l par la moyenne (c’est-à-dire la moyenne) de x.
b. Soustrayez la moyenne de y par le résultat calculé à l’étape 2a.
3. Vérifiez vos résultats.
Coefficient de sensibilité
Lors de l’estimation de l’incertitude avec différentes unités de mesure, l’utilisation de coefficients de sensibilité est une excellente option pour faciliter le processus. Simplement, les coefficients de sensibilité convertiront vos influences d’incertitude en unités de mesure similaires avant de calculer l’incertitude combinée.
Définition
Facteur qui corrèle la relation entre une variable individuelle (c’est-à-dire le facteur d’incertitude) et l’effet qu’elle a sur le résultat final.
Équation

Comment calculer
1. Identifiez l’équation ou la fonction qui définira la valeur de la variable y.
2. Choisissez deux valeurs différentes (e.g. max et min) pour la variable x.
3. Calculez le résultat de la variable y pour chaque valeur de la variable x.
4. Soustrayez les résultats de la variable y (c’est-à-dire y2 – y1).
5. Soustrayez les résultats de la variable x (c’est-à-dire x2 – x1).
6. Divisez le résultat de l’étape 4 par le résultat de l’étape 5.
Covariance
Lorsque vous souhaitez connaître l’influence d’une variable sur le résultat d’une équation, vous devez utiliser la fonction de covariance pour évaluer la force de la corrélation.
Définition
Mesure de la force de la corrélation entre deux ou plusieurs ensembles de variables aléatoires. Une covariance positive signifie que les variables sont positivement liées, tandis qu’une covariance négative signifie que les variables sont inversement liées.
Équation

Comment calculer
1. Soustrayez chaque valeur de x par la moyenne (c’est-à-dire la moyenne) de x.
2. Soustrayez chaque valeur de y par la moyenne (c’est-à-dire la moyenne) de y.
3. Multipliez les résultats de l’étape 1 et de l’étape 2.
4. Répétez les étapes 1 à 3 pour chaque valeur de x et y.
5. Ajoutez les résultats de l’étape 4.
6. Soustrayez le nombre d’échantillons de la valeur 1.
7. Divisez les résultats de l’étape 5 par le résultat de l’étape 6.
Corrélation
Une fois que vous avez déterminé que deux variables ou plus sont corrélées, vous pouvez évaluer la force de la dépendance. La fonction de corrélation vous aidera à y parvenir.
Définition
Une grandeur mesurant la force de l’interdépendance de deux quantités variables.
Équation

Comment calculer
1. Calculez la covariance de X et Y.
2. Multipliez l’écart-type de x et l’écart-type de y.
3. Divisez le résultat de l’étape 1 par le résultat calculé à l’étape 2.
Coefficient de corrélation (R)
Après avoir effectué une régression, vous pouvez déterminer si deux variables sont influencées l’une par l’autre. Pour le savoir, utilisez le coefficient de corrélation pour déterminer la force et la direction de leur relation.
Définition
Grandeur mesurant l’intensité de l’interdépendance linéaire de deux grandeurs variables.
Équation

Comment calculer
1. Soustrayez la valeur de x par la moyenne (c’est-à-dire la moyenne) de x.
2. Mettez au carré le résultat de l’étape 1.
3. Soustrayez la valeur de y par la moyenne (c’est-à-dire la moyenne) de y.
4. Équerrez le résultat de l’étape 3.
5. Multipliez le résultat de l’étape 2 par le résultat de l’étape 4.
6. Répétez les étapes 1 à 5 pour chaque valeur de x et y dans le jeu d’échantillons.
7. Additionnez tous les résultats calculés à l’étape 6.
8. Soustrayez la valeur de x par la moyenne (c’est-à-dire la moyenne) de x.
9. Équerrez le résultat de l’étape 1.
10. Répétez les étapes 8 et 9 pour chaque valeur de x dans le jeu d’échantillons.
11. Additionnez tous les résultats calculés à l’étape 10.
12. Soustrayez la valeur de y par la moyenne (c’est-à-dire la moyenne) de y.
13. Mettez au carré le résultat de l’étape 1.
14. Répétez les étapes 12 et 13 pour chaque valeur de y dans le jeu d’échantillons.
15. Additionnez tous les résultats calculés à l’étape 14.
16. Multipliez les résultats de l’étape 10 et de l’étape 14.
17. Calculez la racine carrée du résultat à l’étape 16.
18. Divisez le résultat de l’étape 7 par le résultat de l’étape 17.
Règles d’évaluation
1. La relation linéaire la plus forte est indiquée par un coefficient de corrélation de -1 ou 1.
2. La relation linéaire la plus faible est indiquée par un coefficient de corrélation de 0.
3. Un coefficient de corrélation positif signifie qu’une variable augmente en même temps que l’autre variable.
4. Un coefficient de corrélation négatif signifie qu’une variable augmente alors que l’autre variable diminue.
Coefficient de détermination (R2)
Une autre méthode couramment utilisée pour évaluer les modèles de régression est le coefficient de détermination. Il s’agit d’une fonction qui évalue la « qualité de l’ajustement » du modèle, c’est-à-dire la façon dont le modèle s’ajuste aux données.
Après avoir trouvé une équation qui modélise votre fonction de mesure, il est important de déterminer dans quelle mesure le modèle s’ajuste aux données. Le coefficient de détermination est la fonction la plus couramment utilisée pour déterminer la qualité de l’ajustement.
Définition
Proportion de variance dans la variable de sortie y qui est prévisible à partir de la variable d’entrée x.
Équation

Comment calculer
1. Calculez la somme des carrés des résidus ;
un. Soustraire la variable de sortie prédite y par la variable prédite.
b. Équerrez le résultat calculé à l’étape 1a.
c. Répétez les étapes 1a et 1b pour chaque variable de sortie y.
d. Additionnez les résultats calculés à l’étape 1c.
2. Calculez la somme totale des carrés ;
un. Soustraire la variable de sortie y par la moyenne
b. Équerrez le résultat calculé à l’étape 2a.
c. Répétez les étapes 2a et 2b pour chaque variable de sortie y.
d. Additionnez les résultats calculés à l’étape 2c.
3. Divisez le résultat calculé à l’étape 1 par le résultat calculé à l’étape 2.
4. Soustrayez le résultat calculé à l’étape 3 de la valeur 1.
Règles d’évaluation
1. Une valeur de 0 signifie que la variable dépendante y ne peut pas être prédite à partir de la variable indépendante x.
2. Une valeur de 1 signifie que la variable dépendante y peut être prédite sans erreur à partir de la variable indépendante x.
3. Une valeur comprise entre 0 et 1 indique dans quelle mesure la variable dépendante est prévisible (par exemple, 0,90 signifie que 90 % de la variance de y est prévisible à partir de x),
Théorème central limite
Lorsque vous estimez l’incertitude, vous combinez de nombreuses distributions de probabilité différentes. Pour cette raison, il est important de connaître le théorème central limite pour comprendre comment votre estimation de l’incertitude se rapproche d’une distribution normale.
Définition
La distribution de la moyenne (c’est-à-dire la moyenne) d’un grand nombre de variables indépendantes et distribuées de manière identique sera à peu près normale, quelle que soit la distribution sous-jacente.

Plus vous collectez d’échantillons, plus vos données commencent à ressembler à une distribution normale.

Écart type de la moyenne
Parfois, vous souhaitez en savoir plus sur vos données ; Plus précisément, l’incertitude de votre résultat de mesure moyen ou l’incertitude de votre incertitude calculée. L’écart-type de la moyenne vous indiquera la variabilité de votre moyenne calculée.
Définition
Une estimation de la variabilité entre les moyennes d’échantillon si plusieurs échantillons ont été prélevés dans la même population.
Écart-type de la moyenne par rapport à l’écart-type
L’écart-type de la moyenne estime la variabilité entre les échantillons, tandis que l’écart-type mesure la variabilité au sein d’un seul échantillon.
Équation

Comment calculer
1. Calculer l’écart-type d’un ensemble d’échantillons.
2. Comptez le nombre d’échantillons prélevés.
3. Calculez la racine carrée du résultat de l’étape 2.
4. Divisez les résultats de l’étape 2 par le résultat de l’étape 1.
Intervalles de confiance
Lorsque vous devez définir des paramètres qui garantissent qu’un pourcentage spécifique de résultats se produit dans cette région, vous souhaitez établir des intervalles de confiance.
Définition
Plage de valeurs estimée qui est susceptible d’inclure un paramètre de population inconnu, la plage estimée étant calculée à partir d’un ensemble donné de données d’échantillon.
Équation

Où

Pour un écart-type connu : 
Pour un écart-type inconnu : 
Comment calculer
Trouvez Zα/2
1. Choisissez le niveau de confiance souhaité (par exemple, 95 %).
2. Calculez la valeur de alpha sur 2.
un. Divisez le résultat de l’étape 1 par 100.
b. Soustrayez la valeur de 1 par le résultat calculé à l’étape 2a.
c. Divisez le résultat de l’étape 2b par 2 (pour les distributions bilatérales).
3. Calculez la probabilité critique (p) :
un. Soustrayez la valeur de 1 par le résultat calculé à l’étape 2c.
4. À l’aide du résultat de l’étape 3, reportez-vous au tableau des valeurs critiques Z pour le facteur d’expansion z.
un. Trouvez le résultat calculé à l’étape 3a dans le tableau des valeurs critiques Z.
b. Déterminez la valeur de la ligne qui se croise (colonne la plus à gauche).
c. Trouvez la valeur de la colonne qui se croise (ligne du haut).
d. Additionnez les résultats des étapes 4a et 4b.
Tableau des valeurs critiques Z


Trouvez tα/2
1. Choisissez le niveau de confiance souhaité (par exemple, 95 %).
2. Comptez les degrés de liberté.
3. À l’aide du résultat de l’étape 2, reportez-vous à la table T de Student pour le facteur d’expansion t.
un. Recherchez la colonne qui correspond au niveau de confiance choisi.
b. Trouvez la ligne qui correspond au nombre de degrés de liberté.
c. Trouvez la valeur à l’intersection des résultats de 3a et 3b.
Table T de l'étudiant

Score Z
Vous souhaitez déterminer le nombre d’écarts-types d’un résultat par rapport à la moyenne ou à la moyenne de la population ? Évaluez le résultat en calculant le score Z du résultat.
Définition
Mesure statistique de la relation entre un score (c’est-à-dire la moyenne du nombre d’écarts-types au-dessus ou en dessous de la population) et la moyenne d’un ensemble de scores.
Équation

Comment calculer
1. Choisissez une valeur dans l’ensemble de données.
2. Soustrayez la valeur par la moyenne de la population (c’est-à-dire la moyenne).
3. Divisez le résultat de l’étape 2 par l’écart-type de l’ensemble d’échantillons.
T-Score
Une autre méthode pour déterminer l’écart entre un résultat et la moyenne est le score T. L’avantage d’utiliser le score T, plutôt que le score Z, est qu’il est généralement plus facile d’évaluer et d’expliquer les résultats.
Définition
Rapport entre l’écart d’un paramètre estimé par rapport à sa valeur notionnelle et son erreur type.
Équation

Comment calculer
1. Calculez la moyenne de l’échantillon, x.
2. Calculez la moyenne de la population, μ.
3. Calculer l’écart-type de l’échantillon, s.
4. Comptez le nombre d’échantillons indépendants, n° 1.
5. Soustrayez la moyenne de l’échantillon par la moyenne de la population.
6. Calculez la racine carrée du nombre d’échantillons.
7. Divisez l’écart-type de l’échantillon par le résultat calculé à l’étape 6.
8. Divisez le résultat calculé à l’étape 5 par le résultat calculé à l’étape 7.
Distribution T de Student
Utilisez la distribution T de Student pour établir des intervalles de confiance basés sur le nombre de degrés de liberté.
Définition
Distribution de probabilité utilisée pour estimer les paramètres de population lorsque la taille de l’échantillon est petite et/ou lorsque la variance de la population est inconnue.
Équation

Comment calculer
1. Choisissez l’intervalle de confiance souhaité, α.
2. Calculez les degrés de liberté, n-1.
3. Référez-vous au tableau T de l’étudiant pour trouver votre facteur de couverture ;
un. Recherchez la colonne qui correspond à l’intervalle de confiance souhaité.
b. Trouvez la ligne qui correspond aux degrés de liberté calculés.
c. Trouvez l’intersection de la colonne et de la ligne pour trouver la valeur de t.
Distributions de probabilité
Réduisez vos influences d’incertitude à des équivalents d’écart-type en fonction de la distribution des données de population. Déterminez la distribution de probabilité qui décrit le mieux vos données et utilisez le graphique ci-dessous pour trouver le diviseur approprié.

Conclusion
Les statistiques sont un élément clé pour calculer l’incertitude de mesure. Sans statistiques, vous ne seriez pas en mesure d’estimer l’incertitude et d’évaluer vos résultats.
J’espère que ce guide d’introduction aux statistiques vous sera utile et qu’il constituera un outil de référence pratique pour vos efforts d’analyse de l’incertitude.
Encore une fois, il ne s’agit que d’une introduction aux statistiques pour l’analyse de l’incertitude. Je publierai un guide plus complet avec des fonctions statistiques avancées à l’avenir. En attendant, si vous pensez que j’ai oublié quelque chose, veuillez m’envoyer un e-mail pour recommander des fonctions supplémentaires.
Maintenant, laissez un commentaire ci-dessous en me disant sur quelle fonction statistique vous aimeriez en savoir plus.




17 commentaires