Scipy Crosstab

Scipy Crosstab

Le langage de programmation Python offre une variété de bibliothèques incroyables qui fournissent une longue liste de fonctions utiles. En utilisant ces bibliothèques et fonctions, toute application pratique peut être gérée facilement. Dans cet article, nous expliquerons la fonction Crosstab disponible dans la bibliothèque Scipy. La bibliothèque Scipy est l'une des bibliothèques les plus couramment utilisées du langage de programmation Python car il offre des fonctions pour toutes sortes d'opérations statistiques et mathématiques. Crosstab est la fonction d'une autre bibliothèque Scipy dans laquelle nous discuterons dans ce guide. Laissez-nous commencer!

Qu'est-ce que Crosstab?

Crosstab signifie une tabulation croisée qui est utilisée pour créer un tableau d'urgence de deux ou plusieurs facteurs en comptant les fréquences des paires correspondantes. En termes simples, il renvoie un tableau qui contient le nombre de chaque combinaison unique des éléments en deux ensembles de données ou plus. Il peut être utilisé pour effectuer une puissante analyse des données en construisant un tableau récapitulatif.

Dans cet article, nous démontrerons quelques exemples pour vous montrer comment utiliser la fonction Crosstab dans un programme Python. Avec ces exemples, vous pourrez mieux comprendre la fonction et pourrez la mettre en œuvre dans vos programmes. Avant de passer à la section des exemples, comprenons la syntaxe de la fonction Crosstab.

Quelle est la syntaxe de la fonction Crosstab?

La fonction Crosstab est fournie par la bibliothèque SCIPY dans le package des statistiques et la classe d'urgence. La syntaxe de la fonction crosstab est la suivante:


Les ensembles de données de paramètres * représentent la séquence des ensembles de données dont la tabulation croisée doit être calculée. La taille ou les éléments doit correspondre à tous les ensembles de données. Les niveaux et les paramètres clairsemés sont des paramètres facultatifs. S'ils ne sont pas fournis, leur valeur par défaut sera utilisée. L'argument des niveaux contient la liste des éléments qui doivent être comptés dans les ensembles de données. Le nombre des «niveaux» et le nombre des ensembles de données devraient être les mêmes.

Les valeurs données dans le paramètre du niveau sont comptées dans les ensembles de données. Si des valeurs correspondantes n'existent pas dans l'ensemble de données, ils seront ignorés et leur nombre ne sera pas renvoyé dans le tableau qui en résultera. Le paramètre Spares détient une valeur vraie ou fausse, indiquant s'il faut renvoyer une matrice clairsemée ou non. C'est faux par défaut.

La fonction Crosstab renvoie deux éléments - l'un est un tuple de longueur et l'autre compte. Le «tuple de longueur» contient la séquence d'éléments qui sont comptés. L'élément «Count» contient le nombre de chaque paire de contingence qui est également connue sous le nom de table d'urgence. Maintenant que nous avons appris la syntaxe de la fonction Crosstab, voyons quelques exemples pour comprendre comment la fonction de crosstab peut être implémentée dans un programme Python.

Exemple 1:

Commençons par un exemple simple afin que nous n'ayons aucun problème à comprendre le fonctionnement de base de la fonction de crosstab. Considérez l'exemple de code dans l'extrait de code suivant:

de Scipy.Statistiques.Importation d'urgence Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ' ]]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]]
(Avals, xvals), count = crosstab (a, x)
print ('Array 1 contient:', Avals)
print ('\ narray 2 contient:', xvals)
print ('\ nthe count of crosstab est: \ n', count)


Tout d'abord, la bibliothèque SCIPY ainsi que le package des statistiques et la classe d'urgence sont importées dans le programme pour appeler la fonction Crosstab. Après cela, deux tableaux de la même longueur sont fournis. Les deux sont transmis à la fonction crosstab. Trois variables sont déclarées, chacune détenant un résultat unique de la fonction de crosstab. Maintenant, voyons le résultat de la fonction de crosstab dans ce qui suit:


Le premier tableau contient 2 articles uniques - A et B. Tandis que le deuxième tableau contient trois éléments uniques - x, y et z. Le nombre de contingence est [[2, 2, 2] [2, 2, 2]], ce qui signifie que la paire (a, x) se produit deux fois, la paire (a, y) se produit deux fois, la paire (a, z ) se produit deux fois, la paire (b, x) se produit deux fois, la paire (b, y) se produit deux fois et la paire (b, z) se produit deux fois.

Exemple 2:

Comme nous l'avons discuté dans l'exemple précédent, le crosstab accepte autant d'ensembles de données que vous pouvez fournir. Il calcule la table de contingence pour tous les ensembles de données. Dans l'exemple précédent, nous n'avons fourni que 2 ensembles de données. Ajoutons un de plus et voyons le résultat de la fonction de crosstab. Considérez l'exemple de code suivant:

de Scipy.Statistiques.Importation d'urgence Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ' ]]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]]
P = [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
(Avals, XVals, Pvals), Count = Crosstab (A, X, P)
print ('Array 1 contient:', Avals)
print ('\ narray 2 contient:', xvals)
print ('\ narray 3 contient:', pvals)
print ('\ nthe count of crosstab est: \ n', count)


Maintenant, voyons la sortie suivante pour comprendre comment le résultat des changements de crosstab:


Depuis que nous avions trois ensembles de données, le premier ensemble de données contient deux éléments uniques - A et B. Le deuxième ensemble de données contient trois éléments uniques - X, Y et Z. Et le troisième ensemble de données contient deux éléments uniques - 0 et 1. Nous avons les paires suivantes (a, x, 0), (a, x, 1), (a, y, 0), (a, y, 1), (a, z, 0), (a, z, 1), (b, x, 0), (b, x, 1), (b, y, 0), (b, y, 1), (b, z, 0), (b, z, 1) , avec des comptes [[[2 0] [0 2] [2 0]] [[0 2] [2 0] [0 2]]], respectivement.

Exemple 3:

Comme nous le savons, Crosstab prend deux paramètres facultatifs - l'un est des niveaux et l'autre est clairsemé. Dans cet exemple, nous vous guiderons sur la façon de fournir explicitement les paramètres de niveau et comment la fonction de crosstab le gère. Considérez l'exemple suivant:

de Scipy.Statistiques.Importation d'urgence Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ' ]]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, xvals), count = crosstab (a, x, niveaux = (opt, opt))
print ('Array 1 contient:', Avals)
print ('\ narray 2 contient:', xvals)
print ('\ nthe count of crosstab est: \ n', count)


Comme nous l'avons discuté précédemment, le nombre de niveaux devrait être le même que le nombre d'ensembles de données. Donc, nous donnons les niveaux = (opt, opt) pour correspondre au nombre d'ensembles de données. Voyons le tableau d'urgence dans la sortie suivante:

Exemple 4:

Le deuxième argument facultatif de la fonction Crosstab est clairsemé. Dans cet exemple, nous définirons explicitement le paramètre clairsemé comme vrai pour obtenir la matrice clairsemée en conséquence. Considérez l'exemple de code dans l'extrait de code suivant:

de Scipy.Statistiques.Importation d'urgence Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ' ]]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, xvals), count = crosstab (a, x, niveaux = (opt, opt), clairsemé = true)
print ('Array 1 contient:', Avals)
print ('\ narray 2 contient:', xvals)
Print ('\ nthe Crsese Matrix est: \ n', count)
print ('\ nthe count of crosstab est: \ n', count.UN)


Voici la sortie de la fonction crosstab qui contient tous les paramètres requis et facultatifs:

Conclusion

Cet article est un aperçu rapide de la fonction Crosstab fournie par la bibliothèque Scipy. Crosstab signifie Tabulation transversale. Il est utilisé pour obtenir le tableau d'urgence des données données. Il faut une liste d'ensembles de données, compte la contingence des éléments donnés dans l'ensemble de données et renvoie le tableau des dénombrements. Avec l'aide d'exemples, nous avons appris à fournir les différents paramètres de la fonction et à obtenir le résultat souhaité.