La fonction pandas décrite () vous permet d'obtenir le résumé statistique des données au sein de votre pandas dataframe. La fonction renvoie des informations statistiques sur les données, y compris la moyenne statistique, l'écart type, les valeurs MIN et MAX, etc.
Syntaxe de fonction
La syntaxe de fonction est comme indiqué ci-dessous:
1 | Trame de données.décrire (centiles = aucun, inclure = aucun, exclure = aucun, datetime_is_numeric = false) |
Paramètres de fonction
La fonction accepte les paramètres suivants:
Valeur de retour de fonction
La fonction renvoie un dataframe avec chaque ligne tenant le type de propriété statistique des colonnes.
Exemple
Considérez l'exemple ci-dessous qui illustre l'utilisation principale de la fonction décrite () dans pandas
1 2 3 4 5 6 | Importer des pandas en tant que PD df = pd.Trame de données( "First_name": ['fracis', 'Bernice', 'Debra'], "Last_name": ['Barton', 'Wyche', 'Wade'], Index = [1,2,3]) df.décrire() |
Dans l'exemple ci-dessus, nous commençons par importer la bibliothèque Pandas. Nous créons ensuite une méthode de données de données simple et appelons la méthode décrit ().
Le code ci-dessus doit renvoyer un résumé d'informations de base sur le dataframe. Un exemple de sortie est comme indiqué
Notez comment la fonction renvoie des informations statistiques de base telles que le nombre de valeurs, combien sont uniques, la valeur supérieure, etc.
Exemple n ° 2
Considérez l'exemple ci-dessous qui renvoie le résumé statistique d'une série Pandas:
1 2 | S = PD.Série ([10,20,30]) s.décrire() |
Dans cet exemple, la fonction doit renvoyer une sortie comme indiqué:
Dans ce cas, la fonction renvoie des informations de résumé de base telles que la moyenne standard, 25e, 50e et 75e centiles, et la valeur maximale de la série.
Exemple n ° 3
Pour décrire une colonne spécifique dans un Pandas DataFrame, utilisez la syntaxe comme indiqué ci-dessous:
1 | Trame de données.nom de colonne.décrire() |
Exemple n ° 4
Pour exclure un type de données spécifique à partir du résultat, utilisez la syntaxe indiquée:
1 | df.décrire (exclure = [np.Type de données]) |
Exemple n ° 5
Pour décrire toutes les colonnes dans un dataframe, quel que soit le type de données, exécutez le code:
1 | df.décrire (inclure = «tout») |
Conclusion
Dans cet article, nous avons discuté de la façon d'utiliser la fonction décrite () dans Pandas.