Les statistiques de Scipy sont biaisées

Les statistiques de Scipy sont biaisées
Dans l'ère d'aujourd'hui des technologies de pointe, la demande de langage de programmation de niveau haute performance a augmenté. Python se révèle être le meilleur de tous les langages de programmation car il a beaucoup à donner pour les fonctions faciles et adaptées aux débutants de la liste de ses packages de bibliothèque pour l'implémentation et l'exécution des logiciels. Python est le meilleur outil de programmation pour l'analyse des ensembles de données grands et grands, à des fins de calcul et de structures orientées objet. Python a une bibliothèque nommée «Scipy» pour faire face au déploiement des modèles d'apprentissage en profondeur, à la formation du modèle pour les applications d'apprentissage automatique, aux opérations mathématiques et aux optimisateurs.

Scipy Stats «Skew» est la méthode utilisée pour rechercher l'asymétrie dans la distribution des variables de l'ensemble de données. L'asymétrie définit comment la variable est distribuée en pic et si la queue de distribution est plus épaisse du côté droit, ce qui signifie positivement ou si la queue est biaisée négativement, la queue est plus épaisse sur le côté gauche et zéro biaisée lorsque la distribution est normale.

Procédure

La procédure de l'article comprendra des étapes séquentielles. Ainsi, premièrement, la syntaxe sera expliquée pour la fonction de biais de statistiques Scipy. Ensuite, le processus d'exécution de cette fonction dans le code Python sera affiché dans l'article. Enfin, nous concluons l'article en discutant des résultats de la mise en œuvre de la fonction. Tous les programmes seront écrits dans la plate-forme en ligne pour Python I.e. "Google Collab". Pour commencer avec cette plate-forme, nous devons naviguer vers l'adresse Web https: // colab.recherche.Google.com /.

Syntaxe

La fonction "$ scipy.Statistiques.biais (tableau, axe = 0, biais = true)”Est ​​utilisé pour calculer l'asymétrie pour la variable aléatoire dans un ensemble de données

Le «tableau» du paramètre dans la liste d'arguments de la fonction Skews de statistiques est remplacé par n'importe quel tableau d'entrée ou l'ensemble de données dont nous voulons déterminer l'asymétrie. L '«axe» est que l'axe où ou le long de laquelle l'asymétrie doit être calculée et sa valeur par défaut est «0». Le biais est toujours défini sur le type booléen «vrai» comme valeur statistique.

Valeur de retour

La fonction renverra une valeur qui nous fera savoir si la distribution est biaisée positivement, négativement ou zéro conformément à la distribution normale.

Exemple # 01

L'asymétrie est la mesure pour analyser l'asymétrie dans la distribution des données. Explorons simplement cette fonction et effectuons un exemple pratique de cette fonction en supposant puis en définissant certaines données hypothétiques, puis en la distribuant pour vérifier son asymétrie. Pour initialiser l'exemple, redirigez vers la collaboration Google et y faire un nouveau cahier pour y écrire un programme Python pour l'exemple. Pour importer les bibliothèques qui seront utilisées pour utiliser l'attribut ou le module «Stats Skew ()», nous écrivons la toute première ligne du script Python comme «de Scipy. Les statistiques importent le biais »et pour créer la bibliothèque« Numpy »d'importation de tableau puisque cette bibliothèque fonctionne avec le tableau multidimensionnel et ses opérations.

Donc, importez le «Numpy comme le préfixe NP». La dernière bibliothèque à importation sera «Pylab», puis nous accéderons au pylab en tant que «PLT» pour tracer la distribution le long de certains axes pour identifier visuellement l'asymétrie dans cette distribution. Maintenant, nous allons créer un tableau bidimensionnel et calculerons ensuite l'asymétrie pour le tableau basé sur l'axe puisque le tableau 2D a deux axes au total. L'un est défini sur la valeur par défaut comme «zéro» et la valeur de l'autre que nous devons définir comme «1»,. Ainsi, nous allons d'abord calculer le biais de la 2D -Rray avec l'axe réglé sur zéro et par la suite à cela, nous définirons la valeur de l'axe sur «1» pour calculer l'asymétrie pour cet axe. Définissez un array 2D avec le «NP de Numpy. Array ([]) ”Méthode et passer les éléments comme« ([3, 4, 6, 8, 9], [1, 2, 5, 7,4], [9, 10, 4, 5, 6])) », Stockez la valeur de ce tableau dans la variable comme« array_skew ». Ensuite, à partir du module statistiques, appelez la fonction skew () et donnez le nom du tableau comme «array_skew» dans les arguments de la fonction de biais. La valeur de l'axe dans ces appels est défini par défaut sur la valeur «zéro» et vérifiez les résultats.

Nous pouvons à nouveau utiliser le même tableau et le transmettre à la fonction skew () mais cette fois avec le paramètre de l'axe défini pour valoriser «1» et séparé par la virgule dans la liste d'argument de la fonction skew (). Le code et la sortie de ce programme sont donnés ci-dessous.

La fonction sera calculer pour le premier appel de la fonction de biais certaines valeurs de l'asymétrie le long de l'axe «0» et le deuxième appel de fonction de la méthode de l'inclinaison renverra la valeur de l'asymétrie pour l'ensemble du tableau le long de l'axe «1».

Exemple # 02

Les exadata précédents n'ont renvoyé que les valeurs asymétriques pour le tableau, mais avec l'aide de cet exemple, nous tracerons la distribution et identifierons ensuite visuellement l'asymétrie dans la distribution des données. Importer le «de Scipy. Statistiques le module de biais », le« NP »forment le Numpy pour définir le tableau, et le« pylab en tant que PLT »pour tracer la distribution sur les deux axes.

Après l'importation de ces bibliothèques, nous définirons l'axe «0» comme le tableau avec la valeur «NP. lispace (-4, 8.5, 1000) ". Ensuite, nous définirons un autre axe comme «axe1» et passerons la valeur de l'axe0 à l'axe 1 comme «1./ (np. SQRT (2.* NP.pi)) * np. Exp ( -.4 * (axe0) ** 2) ». Maintenant, nous utiliserons ces deux axes et avec l'aide du module PLT du Pylab, nous allons tracer les résultats de l'asymétrie en passant l'axe1 et l'axe à la liste des arguments de la fonction de tracé comme «PLT. Plot (axis0, axe1, *) ”puis affichant les résultats comme un" imprimer ("skew_value:", skew (axis1)) ". La valeur de la fonction de biais est renvoyée comme un nombre positif, ce qui signifie que la distribution est biaisée positivement.

Conclusion

La mise en œuvre du «scipy .statistiques skew () ”est indiquée dans l'article. L'article explique le concept d'asymétrie en donnant une introduction sur le rôle de l'asymétrie dans la distribution des données. Ensuite, il explique la syntaxe pour cela dans le script Python et démontre deux exemples pour permettre aux lecteurs de saisir complètement le concept du sujet.