Qu'est-ce que ZSCORE?
Dans les statistiques, le z-score est la différence entre la moyenne et l'écart type. Vous prenez un point de vos données, vous en soustraire la moyenne, puis la divisez par l'écart type. En d'autres termes, Zscore est la mesure de la dispersion des données, il indique donc combien de valeurs la moyenne des données est éloignée de l'écart type des données. Le Zscore négatif montre que l'écart type est inférieur à la moyenne, le 0 Zscore montre que la moyenne et l'écart type sont les mêmes, et le Zscore positif montre que l'écart type est supérieur à la moyenne.
Qu'est-ce que Scipy Zscore?
Le Zscore est une méthode qui est donnée dans la bibliothèque Scipy de Python. Il est utilisé pour calculer automatiquement le Zscore dans le langage de programmation Python. Tout ce que vous avez à faire est de fournir vos données et de laisser la fonction Zscore faire le travail. La syntaxe de la fonction Zscore est donnée dans l'illustration suivante pour votre compréhension:
Le Zscore prend un requis et deux paramètres facultatifs. Le paramètre de tableau représente le tableau d'entrée ou les données d'objet, et il doit être fourni car son Zscore doit être calculé. Le paramètre de l'axe est l'axe à côté de laquelle la moyenne doit être calculée. Il s'agit d'un paramètre facultatif, donc si vous ne le mentionnez pas explicitement, la fonction Zscore utilise la valeur par défaut de 0. Le paramètre DOF est un autre paramètre facultatif qui représente le degré de liberté utilisé pour corriger l'écart type. La fonction Zscore renvoie le zscore des données données. Maintenant, apprenons à l'aide d'exemples sur la façon de calculer le Zscore dans un programme Python. Considérez les exemples suivants.
Exemple 1:
Comme discuté précédemment, le Zscore trouve la différence entre la moyenne et l'écart type. Nous devons donc avoir une liste de données d'abord à partir de laquelle nous devons calculer le ZSCORE. Cet exemple explique le processus étape par étape sur la façon de calculer le zscore des données fournies. Considérez l'exemple de code donné dans l'extrait de code suivant:
Importer Numpy comme NP
à partir des statistiques d'importation Scipy
Array1 = [5, 10, 15, 20, 25]
Array2 = [2, 4, 6, 8, 10]
print ("\ narray 1 contient:", array1)
print ("\ narray 2 contient:", array2)
print ("\ narray 1 z-score: \ n", statistiques.zscore (array1))
print ("\ narray 2 z-score: \ n", statistiques.zscore (array2))
Lorsque nous devons utiliser une fonction ou une méthode à partir d'une certaine bibliothèque, nous devons importer la bibliothèque dans le programme avant d'utiliser l'une de ses fonctions afin d'éviter les erreurs. Ainsi, comme vous pouvez le remarquer, nous importons d'abord la bibliothèque Numpy en tant que NP et la bibliothèque Scipy pour importer le package de statistiques. Après avoir importé les bibliothèques requises, nous fournissons deux tableaux de données différentes afin que nous puissions voir les différents résultats de la fonction Zscore. Les deux tableaux sont affichés sur l'écran à l'aide de la commande print (). Les tableaux sont transmis à la fonction Zscore pour calculer le ZSCore. Et la commande print () est à nouveau utilisée pour afficher le résultat. Maintenant, voyons le résultat suivant:
Exemple 2:
Comme nous l'avons appris sur la syntaxe de la fonction Zscore, nous savons qu'il prend un axe de paramètre facultatif qui est 0 par défaut. Dans cet exemple, nous fournissons explicitement la valeur de l'axe 1 pour explorer et comprendre comment la fonction Zscore modifie son calcul. Considérez l'exemple de code suivant:
Importer Numpy comme NP
à partir des statistiques d'importation Scipy
Array1 = [[5, 10, 15, 20, 25], [4, 8, 2, 6, 10]]
Array2 = [[2, 4, 6, 8, 10], [1, 2, 5, 3, 9]]
print ("\ narray 1 contient:", array1)
print ("\ narray 2 contient:", array2)
Print ("\ Narray 1 Z-score le long de l'axe 1: \ n", statistiques.zscore (array1, axe = 1))
Print ("\ narray 2 z-score le long de l'axe 1: \ n", statistiques.zscore (array2, axe = 1))
Encore une fois, les bibliothèques Numpy et Scipy sont importées car nous en avons besoin pour utiliser le package des statistiques et le tableau Numpy avec la fonction Zscore. Comme vous pouvez le remarquer, nous avons fourni 2 tableaux bidimensionnels. Le paramètre de l'axe peut être utilisé avec des tableaux multidimensionnels, nous avons donc utilisé des tableaux bidimensionnels dans cet exemple. L'axe = 1 indique que le Zscore calculé de chaque point de données dans les tableaux est relatif au tableau dans lequel ils se trouvent. Si vous comparez le résultat des deux tableaux avec le résultat qui est calculé dans l'exemple précédent, vous remarquerez peut-être que le résultat de la première dimension est le même car les données sont les mêmes et l'axe = 1. Maintenant, voyons le résultat suivant:
Exemple 3:
Dans les exemples précédents, nous avons utilisé les données simples du tableau et avons spécifiquement défini les données dans les tableaux. Nous pouvons également définir un dataframe pour la fonction ZSCore afin de calculer le Zscore des données dans le dataframe. Dans cet exemple, nous expliquerons comment déclarer un dataframe, puis le transmettre à la fonction ZSCore pour calculer le ZSCore des données données. Considérez l'exemple suivant pour votre compréhension:
Importer des pandas en tant que PD
à partir des statistiques d'importation Scipy
données = PD.DataFrame (NP.aléatoire.Randint (1, 10,
size = (3, 3)), colonnes = ['x', 'y', 'z'])
données.postuler (statistiques.zscore)
La bibliothèque Pandas est importée dans le programme en tant que PD car la fonction DataFrame () est fournie par la bibliothèque Pandas. La bibliothèque Scipy est, comme d'habitude, importée que nous utilisons la fonction ZSCORE. Le dataFrame () est déclaré avec des valeurs aléatoires en utilisant le hasard.Fonction Randint (). La taille de la dataframe est donnée 3 x 3, ce qui signifie 3 lignes et 3 colonnes. Les noms de chaque colonne sont «x», «y» et «z». Le dataFrame () est transmis à la fonction ZSCore pour calculer le Zscore de chaque point de données. Voir le résultat suivant:
Conclusion
Cet article est un aperçu rapide de la fonction Zscore fournie par la bibliothèque Scipy. Dans Python, le Zscore est une fonction fournie par la bibliothèque Scipy qui est utilisée pour calculer automatiquement le Zscore des données données. Ce guide a fourni quelques exemples pour expliquer comment utiliser la fonction Zscore dans un programme Python.