Scipy ANOVA à sens unique

Scipy ANOVA à sens unique
Ce tutoriel vous guidera à travers le travail et la mise en œuvre de la fonction ANOVA de la bibliothèque Scipy. Le langage de programmation Python permet l'exécution de tout type de calcul mathématique, scientifique ou statistique avec ses fonctions intégrées. ANOVA est une fonction statistique que nous expliquerons dans cet article. Nous expliquerons ce qu'est ANOVA à sens unique, quel est son objectif et comment le mettre en œuvre dans un programme Python. Nous fournirons également quelques exemples de programmes pour vous aider à vous guider sur la mise en œuvre unidirectionnelle de l'ANOVA.

Qu'est-ce que ANOVA?

L'ANOVA est l'abréviation de «l'analyse de la variance» qui est un test omnibus. Il est utilisé pour déterminer s'il existe une variation statistiquement significative dans les valeurs moyennes de différents groupes. Il suit les deux hypothèses - l'une dit que les valeurs moyennes de tous les groupes sont égales et l'autre dit qu'il y a une certaine disparité dans la valeur moyenne d'un groupe. Étant donné que l'ANOVA est unidirection. Cependant, si l'ANOVA est significative, il ne peut pas être déterminé quel groupe est différent.

Qu'est-ce que l'ANOVA dans un programme Python?

La bibliothèque Scipy dans le langage de programmation Python fournit la fonction f_oneway () qui est utilisée pour effectuer l'ANOVA unidirectionnelle. La fonction f_oneway () suit l'hypothèse nulle qui teste que la liste des groupes a la même moyenne. Le test est appliqué à plus de deux groupes, et ils peuvent être de tailles différentes. Maintenant, comprenons la syntaxe suivante:

Syntaxe de la fonction f_oneway

Le f_oneway () comprend deux paramètres à fonctionner - l'un est obligatoire et l'autre peut être sauté. Le paramètre «* DataSets» prend la liste des échantillons de données. Vous pouvez fournir autant d'échantillons que vous avez besoin. Il doit y avoir un minimum de deux ensembles de données. Si vous avez des tableaux multidimensionnels, tous les tableaux devraient avoir les mêmes dimensions. Le paramètre «axe» est le paramètre facultatif. Il est utilisé pour spécifier l'axe du tableau le long de lequel le test est appliqué. La fonction f_oneway renvoie les statistiques F et la valeur p associée à lui.

La fonction F_Oneway soulève deux exceptions: Constantinputwarning et dégénéradatawarning. La courte de Constantinput est augmentée lorsque chaque élément des ensembles de données est identique et que la statistique F n'est pas définie ou infinie, donc il renvoie l'une ou l'autre NP.NAN ou NP.infirme. D'un autre côté, le dégénérédatawarning est augmenté lorsque le tableau est de longueur 0 ou 1. Dans ce cas, NP.Nan est retourné pour les statistiques F et la valeur p.

But et fonction de l'ANOVA dans un sens

L'ANOVA est utilisé à sens unique pour comparer les moyens de différents groupes et trouver les similitudes et les différences entre eux. Il faut différents moyens de groupe et tests pour les différences statistiques entre elles. Maintenant, comprenons tout cela avec l'aide d'exemples. Pour implémenter la fonction unidirectionnelle ANOVA, nous devons installer la bibliothèque SCIPY. Assurez-vous que la bibliothèque Scipy est préinstallée. Si ce n'est pas le cas, vous devez l'installer avant d'implémenter la fonction ANOVA unidirectionnelle. Vous pouvez installer la bibliothèque Scipy à l'aide de la commande suivante:

En supposant que la bibliothèque Scipy est préinstallée, nous passons à la section Exemples pour vous guider sur la façon de mettre en œuvre l'ANOVA unidirectionnelle dans le langage de programmation Python.

Exemple 1:

Comme indiqué précédemment, voici une liste de groupes qui doivent être fournis à la fonction ANOVA unidirectionnelle pour obtenir le résultat unidirectionnel ANOVA. Nous fournirons quatre listes à la fonction f_oneway () dans cet exemple. Considérez l'exemple de code suivant:

de Scipy.Statistiques importations f_oneway
P1 = [5, 10, 15, 20, 30]
P2 = [10, 15, 20, 25, 30]
P3 = [15, 20, 25, 30, 35]
P4 = [20, 25, 30, 35, 40]
f_oneway (p1, p2, p3, p4)

La bibliothèque Scipy et son package de statistiques sont appelés à importer la fonction f_oneway. Les ensembles de données sont fournis et transmis à la fonction f_oneway () pour la comparaison moyenne. La sortie est la suivante:

Exemple 2:

Utilisez la fonction aléatoire de la bibliothèque Numpy pour calculer l'ANOVA à sens unique. Considérez l'exemple de code dans l'extrait suivant:

de Scipy.Statistiques importations f_oneway
Importer Numpy comme NP
p1 = np.aléatoire.Rand (2, 10)
p2 = np.aléatoire.Rand (3, 10)
p3 = np.aléatoire.Rand (4, 10)
p4 = np.aléatoire.Rand (5, 10)
p5 = np.aléatoire.Rand (6, 10)
F, p = f_oneway (p1, p2, p3, p4, p5)
Imprimer (f)
Imprimer (P)

Tout comme dans l'exemple précédent, la bibliothèque SCIPY ainsi que le module Statts sont importées dans le programme pour utiliser la fonction f_oneway. La bibliothèque Numpy est importée en NP pour utiliser la fonction aléatoire qui lui est associée. Cinq ensembles de données sont déclarés en utilisant la fonction aléatoire avec différentes gammes et toutes sont transmises à la fonction f_oneway. Maintenant, voyons le résultat de la fonction f_onway pour les ensembles de données contenant les nombres aléatoires. La sortie est la suivante:

Exemple 3:

Jusqu'à présent, nous avons fourni un tableau unidimensionnel à la fonction f_oneway (). Maintenant, passons le tableau multidimensionnel à la fonction f_oneway. Considérez l'exemple de code suivant pour votre compréhension:

Importer Numpy comme NP
de Scipy.Statistiques importations f_oneway
a = np.Array ([[5, 10, 15, 20, 30],
[10, 15, 20, 25, 30],
[15, 20, 25, 30, 35],
[20, 25, 30, 35, 40]])
b = np.Array ([[1, 2, 3, 4, 5],
[2, 3, 4, 5, 6],
[3, 4, 5, 6, 7],
[4, 5, 6, 7, 8]])
c = np.Array ([[2, 4, 6, 8, 10],
[4, 6, 8, 10, 12],
[6, 8, 10, 12, 14],
[8, 10, 12, 14, 16]])
d = np.Array ([[3, 6, 9, 12, 15],
[6, 9, 12, 15, 18],
[9, 12, 15, 18, 21],
[12, 15, 18, 21, 23]])
f_oneway (a, b, c, d)

Encore une fois, les bibliothèques Numpy et Scipy sont importées comme requis pour le programme. Quatre ensembles de données contenant des tableaux multidimensionnels sont déclarés et transmis à la fonction f_oneway. Notez que les dimensions de chaque ensemble de données sont les mêmes et toutes sont déclarées comme des tableaux numpy. Comme mentionné précédemment, les dimensions de tous les ensembles d'échantillons devraient être les mêmes. Sinon, vous vous retrouverez avec des exceptions ou des erreurs. Les statistiques F et la valeur p de la fonction f_oneway sont renvoyées comme suit:

Conclusion

Ce tutoriel est un guide de la fonction unidirectionnelle ANOVA. L'ANOVA est un processus uniforme pour trouver les différences statistiques entre les moyens de différents groupes d'échantillons. La fonction unidirectionnelle ANOVA prend la liste des données de l'échantillon et compare leurs moyennes et renvoie la statistique F et la valeur p des ensembles de données donnés. La bibliothèque Scipy fournit la fonction F-Oneway dans le package des statistiques qui remplit la fonction ANOVA unidirectionnelle. Nous avons démontré quelques exemples pour vous faire apprendre et comprendre comment implémenter la fonction f_oneway dans un programme Python. Pratiquez ces exemples et ayez une bonne maîtrise de la fonction F_Oneway de la bibliothèque Scipy.