Le test d'hypothèse est effectué par analyse statistique. La signification statistique a été calculée à l'aide de la valeur p, qui indique l'ampleur de la probabilité des résultats de la recherche, à condition que certaines affirmations (hypothèse zéro) soient vraies. Si la valeur p est inférieure au seuil de signification prédéterminé (généralement 0,05), le chercheur peut conclure que l'hypothèse nulle n'est pas vraie et accepter l'hypothèse alternative. À l'aide d'un simple test t, vous pouvez calculer une valeur p et déterminer la signification entre deux ensembles de données différents.
Étape
Partie 1 sur 3: Configuration des expériences
Étape 1. Établir une hypothèse
La première étape de l'analyse de la signification statistique consiste à déterminer la question de recherche à laquelle vous souhaitez répondre et à formuler votre hypothèse. Une hypothèse est une déclaration sur vos données expérimentales et explique les différences possibles dans la population étudiée. Pour chaque expérience, une hypothèse nulle et une hypothèse alternative doivent être établies. Généralement, vous comparerez deux groupes pour voir s'ils sont identiques ou différents.
- L'hypothèse nulle (H0) indique généralement qu'il n'y a pas de différence entre les deux ensembles de données. Exemple: le groupe d'élèves qui ont lu le matériel avant le début du cours n'a pas obtenu de meilleures notes que le groupe qui n'a pas lu le matériel.
- Hypothèse alternative (Hune) est une déclaration qui contredit l'hypothèse nulle et que vous essayez de soutenir avec des données expérimentales. Exemple: le groupe d'élèves qui ont lu le matériel avant le cours a obtenu de meilleures notes que le groupe qui n'a pas lu le matériel.
Étape 2. Limitez le niveau d'importance pour déterminer à quel point vos données doivent être uniques pour qu'elles soient considérées comme importantes
Le niveau de signification (alpha) est le seuil utilisé pour déterminer la signification. Si la valeur p est inférieure ou égale au niveau de signification, les données sont considérées comme statistiquement significatives.
- En règle générale, le niveau de signification (alpha) est fixé à 0,05, ce qui signifie que la probabilité que les deux groupes de données soient égaux n'est que de 5 %.
- L'utilisation d'un niveau de confiance plus élevé (valeur p inférieure) signifie que les résultats expérimentaux seront considérés comme plus significatifs.
- Si vous souhaitez augmenter le niveau de confiance de vos données, réduisez davantage la valeur p à 0,01. Des valeurs p inférieures sont couramment utilisées dans la fabrication lors de la détection de défauts de produits. Un haut niveau de confiance est essentiel pour s'assurer que chaque pièce fabriquée remplit sa fonction.
- Pour les expériences de test d'hypothèse, un niveau de signification de 0,05 est acceptable.
Étape 3. Décidez d'utiliser un test unilatéral ou un test bilatéral
L'une des hypothèses utilisées lorsque vous effectuez un test t est que vos données sont normalement distribuées. Les données normalement distribuées formeront une courbe en cloche, la plupart des données se trouvant au milieu de la courbe. Le test t est un test mathématique utilisé pour voir si vos données sont en dehors de la distribution normale, en dessous ou au-dessus de la "queue" de la courbe.
- Si vous n'êtes pas sûr que vos données soient inférieures ou supérieures au groupe de contrôle, utilisez un test bilatéral. Ce test vérifiera la significativité des deux sens.
- Si vous connaissez la direction de la tendance de vos données, utilisez un test unilatéral. En utilisant l'exemple précédent, vous vous attendiez à ce que la note d'un élève augmente. Par conséquent, vous devez utiliser un test unilatéral.
Étape 4. Déterminer la taille de l'échantillon par test-analyse de puissance statistique
La puissance des statistiques de test est la probabilité qu'un certain test statistique puisse donner le résultat correct, avec une certaine taille d'échantillon. Le seuil de puissance de test (ou) est de 80 %. L'analyse de la force d'un test statistique peut être compliquée sans données préliminaires car vous aurez besoin d'informations sur la moyenne estimée de chaque ensemble de données et son écart type. Utilisez le calculateur d'analyse de puissance de test statistique en ligne pour déterminer la taille d'échantillon optimale pour vos données.
- Les chercheurs mènent généralement des études pilotes en tant que matériau pour l'analyse de la force des tests statistiques et comme base pour déterminer la taille de l'échantillon nécessaire pour des études plus vastes et plus complètes.
- Si vous n'avez pas les ressources nécessaires pour mener une étude pilote, estimez la moyenne sur la base de la littérature et d'autres recherches qui ont été effectuées. Cette méthode fournira des informations pour déterminer la taille de l'échantillon.
Partie 2 sur 3: Calcul de l'écart type
Étape 1. Utilisez la formule d'écart type
L'écart type (également appelé écart type) est une mesure de la distribution de vos données. L'écart type fournit des informations sur la similitude de chaque point de données dans votre échantillon. Au début, l'équation de l'écart type peut sembler compliquée, mais les étapes ci-dessous vous aideront dans votre processus de calcul. La formule de l'écart type est s = ((xje –)2/(N-1)).
- s est l'écart type.
- signifie que vous devez additionner toutes les valeurs d'échantillon que vous avez collectées.
- Xje représente toutes les valeurs individuelles de vos points de données.
- est la moyenne des données pour chaque groupe.
- N est le nombre de vos échantillons.
Étape 2. Calculez la moyenne de l'échantillon dans chaque groupe
Pour calculer l'écart type, vous devez d'abord calculer la moyenne de l'échantillon dans chaque ensemble de données. La moyenne est désignée par la lettre grecque mu ou. Pour ce faire, additionnez toutes les valeurs de points de données d'échantillon et divisez par le nombre de vos échantillons.
- Par exemple, pour obtenir le score moyen du groupe d'étudiants qui ont lu le matériel avant le cours, examinons les exemples de données. Pour simplifier, nous utiliserons 5 points de données: 90, 91, 85, 83 et 94.
- Additionnez toutes les valeurs d'échantillon: 90 + 91 + 85 + 83 + 94 = 443.
- Divisez par le nombre d'échantillons, N = 5:443/5 = 88, 6.
- Le score moyen pour ce groupe était de 88. 6.
Étape 3. Soustrayez chaque valeur de point de données d'échantillon par la valeur moyenne
La deuxième étape consiste à terminer la partie (xje –) équation. Soustraire chaque valeur de point de données d'échantillon de la moyenne pré-calculée. En reprenant l'exemple précédent, vous devez effectuer cinq soustractions.
- (90 – 88, 6), (91-88, 6), (85 – 88, 6), (83 – 88, 6) et (94 – 88, 6).
- Les valeurs obtenues sont 1, 4, 2, 4, -3, 6, -5, 6, et 5, 4.
Étape 4. Mettez au carré chaque valeur obtenue et additionnez-les toutes
Mettez au carré chaque valeur que vous venez de calculer. Cette étape supprimera tous les nombres négatifs. S'il y a une valeur négative après l'exécution de cette étape ou le temps après que tous les calculs ont été effectués, vous avez peut-être oublié cette étape.
- En utilisant l'exemple précédent, nous obtenons les valeurs 1, 96, 5, 76, 12, 96, 31, 36 et 29,16.
- Additionnez toutes les valeurs: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Étape 5. Divisez par le nombre d'échantillons moins 1
La formule exprime N – 1 comme un ajustement parce que vous ne comptez pas la population entière; Vous ne prenez qu'un échantillon de la population pour faire une estimation.
- Soustraire: N – 1 = 5 – 1 = 4
- Diviser: 81, 2/4 = 20, 3
Étape 6. Calculez la racine carrée
Après avoir divisé par le nombre d'échantillons moins un, calculez la racine carrée de la valeur finale. Il s'agit de la dernière étape du calcul de l'écart type. Il existe plusieurs programmes statistiques qui peuvent calculer l'écart type après avoir entré les données brutes.
Par exemple, l'écart type des scores pour le groupe d'élèves qui ont lu le matériel avant le début du cours est: s =√20, 3 = 4, 51
Partie 3 sur 3: Détermination de l'importance
Étape 1. Calculez la variance entre les deux groupes d'échantillons
Dans l'exemple précédent, nous n'avons calculé que l'écart type d'un groupe. Si vous souhaitez comparer deux groupes, vous devez disposer des données des deux groupes. Calculez l'écart type du deuxième groupe et utilisez les résultats pour calculer la variance entre les deux groupes de l'expérience. La formule de la variance est sré = ((s1/N1) + (s2/N2)).
- sré est la variance intergroupe.
- s1 est l'écart type du groupe 1 et N1 est le nombre d'échantillons dans le groupe 1.
- s2 est l'écart type du groupe 2 et N2 est le nombre d'échantillons dans le groupe 2.
-
Par exemple, les données du groupe 2 (étudiants qui ne lisent pas le matériel avant le début du cours) ont une taille d'échantillon de 5 avec un écart type de 5,81. Puis la variante:
- sré = ((s1)2/N1) + ((s2)2/N2))
- sré = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Étape 2. Calculez la valeur du test t de vos données
La valeur du test t vous permettra de comparer un groupe de données avec un autre groupe de données. La valeur t vous permet d'effectuer un test t pour déterminer dans quelle mesure la probabilité que les deux groupes de données comparés soient significativement différents. La formule pour la valeur de t est: t = (µ1 –2)/sré.
- ️1 est la moyenne du premier groupe.
- ️2 est la valeur moyenne du deuxième groupe.
- sré est la variance entre les deux échantillons.
- Utilisez la plus grande moyenne comme1 donc vous n'obtenez pas de valeurs négatives.
- Par exemple, le score moyen du groupe 2 (élèves qui ne lisent pas) est de 80. La valeur t est: t = (µ1 –2)/sré = (88, 6 – 80)/3, 29 = 2, 61.
Étape 3. Déterminez les degrés de liberté de l'échantillon
Lors de l'utilisation de la valeur t, les degrés de liberté sont déterminés par la taille de l'échantillon. Additionnez le nombre d'échantillons de chaque groupe puis soustrayez deux. Par exemple, les degrés de liberté (d.f.) sont de 8 car il y a cinq échantillons dans le premier groupe et cinq échantillons dans le deuxième groupe ((5 + 5) – 2 = 8).
Étape 4. Utilisez le tableau t pour déterminer l'importance
Des tableaux de valeurs t et de degrés de liberté peuvent être trouvés dans des livres de statistiques standard ou en ligne. Regardez la ligne montrant les degrés de liberté que vous avez sélectionnés pour vos données et trouvez la valeur p appropriée pour la valeur t dérivée de vos calculs.
Avec des degrés de liberté de 8 d.f. et la valeur t de 2,61, la valeur p pour le test unilatéral est comprise entre 0,01 et 0,025. Étant donné que nous avons utilisé un niveau de signification inférieur ou égal à 0,05, les données que nous utilisons prouvent que les deux groupes de données sont significativement différent, significatif. Avec ces données, nous pouvons rejeter l'hypothèse nulle et accepter l'hypothèse alternative: le groupe d'étudiants qui ont lu le matériel avant le début du cours a obtenu de meilleurs résultats que le groupe d'étudiants qui n'ont pas lu le matériel
Étape 5. Envisagez de faire une étude de suivi
De nombreux chercheurs mènent de petites études pilotes pour les aider à comprendre comment concevoir des études plus importantes. Faire des recherches plus poussées avec plus de mesures augmentera votre confiance dans vos conclusions.