Scipy Chi-Square

Scipy Chi-Square
Python est un langage de programmation de haut niveau bien connu qui permet diverses fonctions d'ingénierie, technique, orientée objet et mathématique et opérations. Python fournit de nombreuses bibliothèques à ses utilisateurs et l'un des langages de programmation les plus renommés et les plus open-source est «Scipy». La bibliothèque Scipy contient des informations et applique ses opérations à différentes méthodes d'apprentissage automatique E.g., Algorithmes d'apprentissage automatique et les optimisateurs que nous utilisons dans des systèmes artificiellement intelligents. Nous utilisons un module chi carré de la bibliothèque Scipy pour passer les différents tests pour les données catégorielles.

Procédure

Dans l'article, nous utiliserons la fonction du chi carré de la bibliothèque Scipy et effectuerons plusieurs tests pour les données. Les informations concernant l'utilisation de cette fonction dans le script Python seront également discutées et appliquées à divers exemples de cet article.

Syntaxe

Puisque nous effectuerons les deux tests pour vérifier la relation entre les variables en utilisant la méthode du chi carré, nous discuterons des deux syntaxes différentes de cette fonction.

Test de chi carré -> $ chisquare (f_obs, ddof = 1, f_exp = aucun, axe = 1)

Test d'indépendance de Chi Square -> $ CHI2_CONNENCENCE (observé, Lambda_ = Aucune Correction = False)

Valeur de retour

Cette fonction renvoie la valeur p et la valeur statistique de test de chi carré dans sa sortie.

Exemple # 01

Nous effectuerons le premier test en utilisant le chi carré dont nous avons discuté dans la syntaxe comme test Chi_square. Ce test nous parle de la relation entre les variables catégorielles. Cette fonction utilise le module d'attribut «statistiques» du scipy. Les statistiques calculent le test où nous devons supposer une hypothèse nulle et le chi carré teste cette hypothèse nulle si les données contiennent ou non les fréquences spécifiées. Il prend les fréquences observées et attendues comme paramètres et si ces deux fréquences sont inférieures ou non au moins «cinq», le test est considéré comme invalide.

Nous exécuterons le même test dans l'exemple, le compilateur que nous utiliserons pour implémenter l'exemple est «Google Collab» qui sert de compilateur open source. Il exécute le programme sans aucun versement des packages de bibliothèque car il contient déjà les packages installés. Après avoir ouvert le compilateur, créez simplement un projet avec un nom unique, puis passez à l'étape suivante où nous importerons les packages de la bibliothèque pour exécuter le test Chi Square.

Le test Chi Square est donné dans le module Python Scipy Statistiques, nous importerons donc les «statistiques» du SCIPY dans notre projet. Une fois que nous aurons importé cette bibliothèque, nous définirons un tableau ayant les éléments comme les fréquences au moins supérieures ou égales à cinq. Nous allons donc définir le tableau avec le nom «tableau» avec les fréquences observées comme «[3, 4, 6, 8, 10, 2]». Après avoir réussi à créer ce tableau, nous appellerons la fonction Chi Square avec les «statistiques» préfixes comme «Statistiques. chisquare () ". À l'argument d'entrée de cette fonction, nous passerons le tableau qui est le F_OBS (fréquence observée) le paramètre de la fonction Chi Square.

Après avoir exécuté le code mentionné dans l'extrait ci-dessous, nous obtiendrons la sortie comme statistique Chi Square et la valeur p. Ce test chisquare sera valable car nous avons défini au moins cinq fréquences observées dans le paramètre de cette fonction.

à partir des statistiques d'importation Scipy
Array = [3,4,8,10,12]
Statistiques.chisquare (tableau)

Exemple # 02

La fonction Chi Square a un autre test pour les variables catégorielles avec le nom du «test chi_square pour l'indépendance». Maintenant, ce test est légèrement différent du test du chi carré dont nous avons discuté dans l'exemple ci-dessus, car ce test vérifie s'il existe une relation significative entre les deux variables de la classe catégorique. Pour ce test, Chi_square utilise la fonction du module statistique «Chisquare Conventence» du Python Scipy. Le test est effectué pour montrer si les variables sont indépendantes les unes des autres ou non. Pour travailler avec cette fonction, créons un autre nouveau tableau. Pour créer et définir ce nouveau tableau, nous devrons importer le Numpy avec le nom «NP» afin que nous puissions appeler le «NP» dans le code plus tard à la place du Numpy.

Un autre package de bibliothèque important qui doit être importé pour le bon fonctionnement du test d'urgence Chi Square est les «statistiques». Nous importerons le module statistiques de la bibliothèque Scipy à partir de la langue Python. Avec l'importation réussie des bibliothèques requises pour le projet ou le test d'indépendance de Chi Square, à l'étape suivante, nous définirons un tableau avec le nom "Obs_array". Nous utiliserons «NP. Array () »La méthode pour créer ce tableau et les dimensions du tableau seront définies sur 2 dimensions et les éléments que ce tableau contiendra sera« ([2, 2, 2], [8, 8, 8] ) ". Ce tableau sera utilisé comme observation qui est le paramètre d'entrée pour la fonction de contingence Chi_2 ().

Pour appeler le test d'urgence pour l'indépendance des deux variables appartenant aux classes catégoriques, nous utiliserons les statistiques du préfixe et appellerons la fonction CHI_2CONNENCENCE comme «Statistiques.CHI2_CONNENCENCE (obs_array) ". Nous exécuterons le code suivant qui est illustré sur la figure pour obtenir les résultats du test d'indépendance de la fonction de contingence Chi Square.

Importer Numpy comme NP
à partir des statistiques d'importation Scipy
obs_array = np.Array ([[2, 2, 2], [8, 8, 8]])
Statistiques.CHI2_CONNENCENCY (obs_array)

Cette fonction renvoie la valeur des statistiques de test Chi Square, la valeur p du test et les valeurs des fréquences qui sont attendues pour les observations que nous passons dans les paramètres de la fonction. La sortie de la fonction est affichée dans la figure ci-dessous.

Conclusion

L'article donne des informations détaillées sur la méthode Chi Square qui utilise le module «Stats» de la bibliothèque Scipy. Nous avons effectué deux types de tests pour les méthodes Chi Square en implémentant les deux exemples différents dans le script Python et avons montré à quoi ressemble la sortie ou les valeurs de retour de cette fonction et ce qu'elles signifient dans le contexte du Scipy Chi Square ( ) méthode.