Fonctions de statistiques Scipy

Fonctions de statistiques Scipy

Dans Python, il existe un package pour les fonctions statistiques dans la bibliothèque Scipy. Le sous-pack de scipy s'appelle Scipy.Statistiques. Il est principalement utilisé pour les procédures statistiques et les distributions probabilistes. Les types de fonctions de probabilité sont nombreux. La nature open-source de la bibliothèque permet l'expansion de sa capacité statistique. Nous pouvons travailler avec une variété de distributions, notamment des distributions binomiales, uniformes et continues. Nous avons des fonctions pour les variables continues et discrètes. De plus, nous pouvons exécuter le test t et calculer le score T. Avec de nombreux exemples, apprenons plus sur les fonctions de statistiques Scipy.

Explication des statistiques de scipy

De nombreuses distributions de probabilité, fréquences et statistiques sommaires, fonctions de corrélation et tests statistiques, estimation de la densité du noyau, statistiques masquées, fonctionnalité quasi-monte carlo et autres caractéristiques sont incluses dans ce module.

Il existe de nombreux domaines dans le vaste domaine des statistiques qui sortent de la portée de Scipy et sont gérés par d'autres packages. Parmi les plus importants figurent:

  • statistiques
  • Pandas
  • PYMC
  • scikit-apprend

Le scipy.Les statistiques sous-package contient toutes les routines statistiques, et la fonction info (statistiques) renvoie une liste plutôt complète de ces fonctions. Les packages de sous-doctring de statistiques contiennent en outre une liste des variables aléatoires disponibles. Ce module comprend une collection importante de distributions de probabilité en plus d'une collection en expansion de fonctions statistiques.

Quelle est la distribution aléatoire continue normale dans Scipy?

Pour englober les variables aléatoires discrètes et continues, deux classes de distribution générales sont développées. La distribution aléatoire continue normale est l'un des types que nous allons discuter ici.

La variable peut avoir n'importe quelle valeur dans ce type de distribution de probabilité. C'est pourquoi il est connu comme une variable aléatoire continue.

Exemple 1:

Le premier exemple ici montre comment les concepts discutés dans la fonction des sections précédentes. Nous importons la fonction norme, qui dérive de la classe RV_continuous, dans cet exemple de code. Les fonctions contiennent des approches et des informations pour aborder une distribution continue particulière.

Pour calculer le CDF sur un tableau, nous utilisons la fonction norme. Faisons un effort pour comprendre le code en ligne par ligne.

Dans la première ligne du code, nous importons la norme du scipy.Bibliothèque de statistiques. Suite à cela, la bibliothèque Numpy est importée pour l'exécution du programme. Une variable nommée «Check» est créée par la suite dans laquelle le tableau Numpy créé est stocké. Enfin, la déclaration d'impression est utilisée dans laquelle la norme.La fonction cdf () est exécutée sur le tableau spécifié. Exécutons le code et voyons quel résultat il produit.

de Scipy.Statistiques d'importation de la norme
Importer Numpy
Vérifier = Numpy.Array ([4, -2,3,2,5,0])
imprimer (norme.cdf (chèque))

Ici, vous pouvez voir le résultat généré à partir du code écrit précédemment.

Une autre chose que nous pouvons faire est d'utiliser la fonction en pourcentage pour déterminer la médiane de la distribution. L'inverse de CDF est PPF, qui est abrégé en PPF.

Ici, vous pouvez voir la médiane des valeurs CDF générées dans le code précédent.

Comment générer une distribution uniforme dans Scipy

Autrement dit, une distribution uniforme indique une probabilité plate et constante qu'une valeur se situe dans une certaine plage. La création d'une distribution uniforme est possible. Après avoir importé la fonction uniforme, nous devons créer le CDF du tableau.

Les mots clés de l'échelle et de LOC nous permettent d'élargir la fonctionnalité. Le mot clé LOC définit la valeur moyenne, tandis que le mot clé de l'échelle définit l'écart type. Voici le code:

Tout d'abord, nous importons le module Numpy et uniforme. Après cela, nous créons la variable dans laquelle nous stockons le tableau Numpy créé. Enfin, la déclaration d'impression peut être vue dans laquelle l'uniforme.La fonction CDF est utilisée.

Importer Numpy
de Scipy.Les statistiques importent un uniforme
Check_res = Numpy.Array ([7,4,9,5,4])
imprimer (uniforme.cdf (check_res, loc = 5, échelle = 3))

Ci-joint est la sortie de votre aide.

Comment générer une distribution binomiale dans Scipy

De plus, en importation de binom, l'instance de la classe discrète RV, nous pouvons produire une distribution binomiale. Il est composé d'informations et de méthodes de classe. Le code est tout à fait le même que dans le code précédent, sauf que nous utilisons le bunom.Fonction CDF () ici qui comprend trois paramètres que vous pouvez voir dans la dernière ligne du code.

Importer Numpy
de Scipy.statistiques importations binoms
sortie = Numpy.Array ([7,4,5,5,4])
imprimer (binom.CDF (sortie, n = 1, p = 3))

Voici le résultat:

Quelles sont les statistiques descriptives?

Les résultats de statistiques fondamentales comme Min, Max, Mean et la variance sont renvoyées en utilisant le tableau Numpy comme entrée. Le tableau suivant répertorie une poignée des opérations statistiques fondamentales incluses dans le SCIPY.Package de statistiques.

Nom de la fonction Description
décrire() Les statistiques descriptives du tableau donné sont calculées via cette option.
gmean () La moyenne géométrique de l'axe spécifié est calculée avec cette option.
Hmean () Le long de l'axe choisi, la moyenne harmonique est calculée par la fonction HMEAN ().
kurtosis () Cette fonction calcule la kurtosis.
mode() Cette méthode renvoie la valeur modale.
fausser() La méthode skew () teste l'asymétrie des données spécifiées.
f_oneway () Cette méthode effectue une ANOVA à 1 sens.
iqr () Il détermine la plage interquartile des données le long de l'axe choisi.
zscore () Il calcule le score z de chaque valeur de l'échantillon. Il est relatif à la moyenne de l'échantillon ainsi qu'à l'écart type.
SEM () Il détermine les nombres dans l'erreur standard du tableau d'entrée de la moyenne.

Qu'est-ce qu'un test t?

Le test t est l'un des meilleurs moyens d'évaluer si deux moyennes sont différentes les unes des autres ou non. Le test t est également un sujet de discussion important en termes de différences de groupe.

T-score

Le score T mesure le rapport de deux groupes ainsi que la variance au sein des groupes. Le score T reflète à quel point les groupes sont similaires ou différents; Plus le score T est petit, plus le score T est important et plus la différence entre les groupes.

Ici, on nous donne deux échantillons qui peuvent provenir de la même distribution ou deux distributions différentes. Et nous voulons déterminer s'ils partagent les mêmes caractéristiques statistiques. Voir le code suivant qui est joint ici:

à partir des statistiques d'importation Scipy
rvs_res = statistiques.norme.VR (loc = 4, échelle = 8, taille = (30,4)))
Print ("Voici le résultat de la comparaison des deux échantillons:")
imprimer (statistiques.ttest_1samp (rvs_res, 4.0))

La sortie est attachée:

Une valeur p dans la sortie précédente représente la probabilité que les résultats de vos données d'échantillon se produisent par accident. La gamme de valeurs de p est de 0% à 100%.

Conclusion

Les fonctions de statistiques Scipy ont fait l'objet de cet article. Le module statistiques de Scipy est un composant crucial. Il est utile d'obtenir les distributions probabilistes. À l'aide de statistiques SCIPY, des nombres aléatoires discrets ou continus peuvent être produits. Il comprend également d'autres fonctions supplémentaires qui fournissent des valeurs statistiques descriptives. Nous avons discuté des variables aléatoires, continues et aléatoires dans ce post. Les fonctions pour interagir avec divers types de distribution sont discutées. De plus, nous avons décrit comment vous pouvez analyser les données à l'aide du test t pour déterminer la valeur moyenne.