Écart type de statistiques Python

Écart type de statistiques Python
La dispersion des données est déterminée en utilisant l'écart type, une mesure cruciale. Cela implique que les données sont plus centralisées lorsque l'écart type est plus petit et plus dispersé lorsque l'écart type est nettement plus élevé. La racine carrée de la variance est utilisée pour le calculer. Même si la variance et l'écart type sont des mesures de la dispersion, l'écart type serait plus fréquemment utilisé en raison de l'utilisation par l'écart type de presque les mêmes mesures que les données.

Par exemple, les tests statistiques et la visualisation des données seraient les capacités d'utiliser l'écart type. Cet article comprend des démonstrations pour chaque méthode que les utilisateurs peuvent utiliser pour déterminer l'écart type d'un ensemble de données dans Python.

Exemple n ° 1:
Pour calculer l'écart-type, nous créerions soit une méthode ou utiliserions des pandas pré-construits ou des techniques Numpy. Créons une version python native de la détermination de l'écart-type sans importer de frameworks externes.

def get_std_dev (liste):
a = len (liste)
m = sum (list) / a
v = sum ((x - m) ** 4 pour x dans la liste) / a
s_dev = v ** 1.5
retourner s_dev
Liste = [17, 22, 44, 13, 29, 72, 60, 27]
get_s_dev (liste)

Au début du programme, nous définirons la fonction de l'écart type. Nous fournissons le paramètre de la liste dans cette fonction. À l'étape suivante, nous trouverons la longueur de la liste requise en utilisant la méthode Len (). La longueur de la liste sera stockée dans une variable «A». Maintenant, nous trouverons la moyenne de la liste requise. Pour déterminer la moyenne de la liste, nous devons d'abord obtenir la somme de la liste, puis la somme calculée sera divisée par la durée de la liste. La moyenne de la liste sera désormais enregistrée dans la variable «M». Trouvez la variance de la liste définie.

Ici, nous appliquons des formules de la variance. Nous avons utilisé la boucle «pour» dans les formules de la variance. De plus, nous utiliserons les formules pour trouver l'écart type. La variance sera multipliée par 1.5. Ce faisant, cela renvoie l'écart-type de la liste spécifiée. Nous déclarons une «liste» variable.

Ici, m nous définissons différentes valeurs aléatoires. Pour représenter l'écart type de la liste, nous avons appliqué la méthode get_s_dev (). Cette fonction contient la liste comme paramètres.

Dans cette illustration, nous avons construit une méthode qui renvoie les écarts-types d'un ensemble d'entiers. Vous verrez que nous avons calculé la somme de la moyenne et de la variance en utilisant la méthode Sum () inbuilt de la langue Python. Cette méthode est utilisée pour calculer la sommation de la séquence définie.

Il y a plusieurs façons à part celle mentionnée ci-dessus pour déterminer l'écart type d'un ensemble de données. Nous pouvons utiliser les solutions de base en une ligne pour calculer les écarts-types en utilisant les modules et en enregistrant les données en tant que tableau Numpy ou un cadre de pandas.

Exemple n ° 2:
L'écart type pourrait être déterminé instantanément en stockant l'ensemble des éléments comme un tableau Numpy et en utilisant la méthode Numpy Ndarray Std (). Jetons un coup d'œil à une instance.

Importer Numpy comme NP
Liste = [17, 23, 14, 33, 19, 10, 40, 62]
x = np.liste des tableaux)
Imprimer (x.std ())

Tout d'abord, nous incorporerons la bibliothèque «Numpy» en tant que NP. De plus, nous définissons les éléments de l'ensemble de données. Ces éléments sont stockés dans une «liste» variable. Ensuite, nous appelons la méthode Array () du module Numpy. Cette méthode contient la liste des éléments comme argument. Dans la dernière étape du code, la méthode print () sera invoquée pour afficher l'écart type de la liste.

Exemple n ° 3:
L'ensemble des données peut également être enregistré comme un package Pandas à partir duquel nous pouvons par la suite calculer l'écart type en utilisant la méthode std (). Cette méthode est probablement comparable à l'approche du tableau Numpy. Beaucoup de fonctions de Pandas sont des conteneurs pour les fonctions Numpy. En ce moment, utilisons le module Pandas pour calculer l'ensemble de l'écart type des éléments.

Importer des pandas en tant que PD
l = [34, 22, 74, 23, 19, 16, 40, 62]
C = PD.Série (l)
imprimer (c.std ())

Ici, nous devons importer le fichier d'en-tête requis «pandas» en tant que PD. Nous spécifions les composants de l'ensemble de données sous forme de liste. Ces valeurs sont enregistrées dans la variable «l."La série de méthodes du module de Pandas () serait alors invoquée. Le paramètre de cette méthode est cet ensemble d'éléments. Les valeurs de liste seront construites dans un package Pandas. La fonction print () pourrait être utilisée dans la ligne de code finale pour afficher l'écart type de la liste. Nous appelons la méthode std () pour déterminer l'écart type de la liste.

Exemple n ° 4:
Dans cet exemple, nous déterminerons l'écart-type des ensembles de données avec différents types de données.

à partir des statistiques importer stdev
à partir des fractions d'importation de fraction comme FR
set_1 = (11, 22, 15, 41, 78, 59, 90)
set_2 = (-21, -14, -33, -51, -35, -26)
set_3 = (-59, -71, -20, 12, 15, 33, 74, 69)
set_4 = (5.13, 4.40, 3.31, 8.5, 7.2)
Imprimer ("L'écart-type calculé de l'ensemble 1:% S"
% (stdev (set_1)))
Imprimer ("L'écart-type calculé de l'ensemble 2:% S"
% (stdev (set_2)))
Imprimer ("L'écart-type calculé de l'ensemble 3:% S"
% (stdev (set_3)))
Impression ("L'écart-type calculé de l'ensemble 4:% S"
% (stdev (set_4)))

Nous allons intégrer la bibliothèque STDEV à partir du module de statistiques et de la fraction comme «FR» du cadre des fractions. Maintenant, nous allons créer quatre ensembles de données différents de différents types de données. Les éléments du premier ensemble de données seront stockés dans une variable 'set_1'. Cet ensemble contient tous les nombres positifs. Le deuxième ensemble de données sera stocké dans une variable 'set_2'. Cet ensemble se compose de toutes les valeurs négatives. Ensuite, nous déclarons une variable 'set_3'.

Ici, nous définissons les éléments du troisième ensemble de données. Cette liste a un mélange de valeurs positives et négatives. Pour stocker les valeurs du dernier ensemble de données, nous initialiserons une variable «set_4». Cet ensemble contient toutes les valeurs à virgule flottante. Imprimons l'écart type de ces ensembles de données. Pour ce faire, nous devons utiliser la fonction print () pour tous les ensembles de données respectivement. L'écart type de tous les ensembles serait calculé en utilisant la méthode stdev ().

Conclusion

Dans cet article, nous avons examiné diverses méthodes pour calculer l'écart type. Dans la première illustration, nous avons calculé l'écart type de l'ensemble de données en calculant sa somme et sa variance. Ensuite, pour obtenir l'écart type de la liste d'éléments prédéfinis, nous utilisons les modules Pandas et Numpy dans les deux cas suivants. Dans la dernière démonstration, nous obtenons l'écart-type des ensembles avec divers types de données.