Méthode d'informations Pandas

Méthode d'informations Pandas
«Le module Pandas de Python est utilisé pour modifier les ensembles de données. Il propose des outils pour la recherche, le filtrage, le traitement et la manipulation des données. L'excellente communauté d'informations de Python Python en fait un langage efficace pour effectuer l'analyse des données. Un de ces outils, Pandas, simplifie considérablement le processus d'importation et d'analyse des données. À l'aide de la fonction info (), vous pouvez rapidement résumer un dataframe. Cette méthode affiche des détails sur une dataframe, tels que ses valeurs non nulles, l'utilisation de la mémoire et les types de données d'index et de colonne pour imprimer le résumé complet. Il imprime uniquement les données contenues dans la trame de données fournies et ne renvoie pas la valeur. Lorsque vous effectuez une étude exploratoire des informations est utile. Nous utilisons le dataframe.Fonction info () pour acquérir rapidement un résumé de l'ensemble de données."

Méthode Syntaxe for Pandas info ()

Nous allons discuter brièvement des paramètres utilisés ici:

Verbeux: L'application de cette propriété permet à l'utilisateur de choisir d'expliquer l'intégralité du rapport

Buf: Ce n'est pas non plus obligatoire. Il détermine où une autre sortie doit être envoyée. Passez le tampon réécrit si vous souhaitez modifier plus la sortie.

Utilisation de la mémoire: Indique si l'utilisation globale de la mémoire des éléments de dataframe, y compris l'index, doit être affichée. Par défaut, cela adhère à la valeur des pandas. options.L'utilisation Display_memory affiche toujours l'utilisation de la mémoire comme «vrai». Ne jamais afficher l'utilisation de la mémoire est «faux».

Max_col: Quand utiliser la sortie raccourcie au lieu de la sortie verbale. La sortie tronquée est utilisée si le DataFrame contient plus de colonnes que la limite des cols max. L'affichage des options du panda.La valeur des colonnes max _info_ est utilisée par défaut.

null_counts: Il sert à indiquer s'il faut afficher ou non des dénombrements nuls.

Exemple n ° 1: Affichez le résumé de la trame de données en utilisant la méthode d'informations avec la valeur verbale True

Nous parlerons du Python Pandas DataFrame.Méthode info () dans cette démonstration. Pour acquérir un rapport DataFrame, nous utilisons cette méthode. Cette fonction affiche des informations sur un ensemble de données, telles que le type d'index et les colonnes, les valeurs non nulles et la consommation de mémoire, lorsqu'elle est invoquée à un dataframe. Parlons maintenant de l'exemple. Nous avons utilisé trois colonnes dans cet exemple; «Entiers», «caractères» et «valeurs flottantes». Il y a quatre nombres basés sur des entiers dans les colonnes «entier», «7», «8», «9» et «10». Nous avons sélectionné quatre valeurs pour le caractère «addition», «soustraction», «multiplication» et «division». Dans la colonne, nous avons la «valeur flottante», il a ces valeurs «1.1 ”,« 1.2 ”,« 1.3 ”et« 1.4 ”.

Après cela, nous avons passé cette liste de valeurs pour générer une trame de données en utilisant le «PD.Méthode de la trame de données »fournie par le module Panda pour construire le cadre de données. Nous avons attribué de nouvelles étiquettes à cette liste «entier» comme «int», «caractère» comme «char» et «float_values» comme «float»; Ces étiquettes seront des titres de colonne de notre cadre de données de sortie. Une déclaration «Description du cadre de données» s'affiche à l'aide de la fonction «print ()».

Ensuite, nous arrivons à la fonction principale du programme, qui est la méthode du cadre de données «info ()». Le cadre de données.La fonction d'information est utilisée pour obtenir un aperçu simple du cadre de données. «DF.info () ”est utilisé ici pour donner un aperçu du code. Dans ce cas, le paramètre que nous avons transmis à cette fonction est «verbeux». Ce paramètre a deux valeurs possibles; "vrai ou faux". «Verbose = true» utilisé ici signifie afficher les informations complètes du cadre de données. «True» afficher l'utilisation de la mémoire. Par conséquent, nous utilisons le «DF.fonction info (verbose = true) ”, qui imprime toutes les informations du cadre de données.

Comme indiqué dans le résultat, il affiche un résumé de code; Tout d'abord, cela nous informe de la classe, qui est «Pandas.cœur.cadre.DataFrame »alors il montre que la plage d'index que nous avons dans cet exemple est« 4 », ce qui signifie que les informations que nous avons entrées dans ce code sont indexées de 0 à 3; donc il y a des entrées de 0 à 3 au total. Les «colonnes de données» dans ce qui suit indique qu'il y a trois colonnes. La première colonne répertorie les noms de colonne, la deuxième colonne répertorie le nombre non nul et la troisième colonne répertorie les types de données pour les données que nous avons entrées. Il mentionne en fin de compte que les types de données que nous avons sont «float64 (1)», «int64 (1)» et «objet (1)», et cela utilise 224.0+ octets de mémoire.

Exemple n ° 2: Affichage du résumé en appliquant la méthode Info () avec une valeur verbale fausse

Indiquant notre deuxième exemple en important le module du panda. Dans cette procédure, un cadre de données avec trois colonnes est créé. Sa première colonne fait référence à «entier», la seconde comme le «caractère», et le troisième comme les «valeurs flottantes». Nous avons trois valeurs dans la colonne «entier», qui sont «4», «5» et «6» et dans la colonne «caractères», nous avons trois variables «A», «B» et «C» et pour la colonne «Valeurs flottantes», nous avons «2.2 ”,« 1.2 ”et« 3.3 ”. Étant donné que la taille de l'indice est «3», cela signifie que nous avons des entrées de «0» à «2."

Dans cet exemple, la méthode «info ()» est utilisée pour obtenir un rapport rapide de DataFrames sans afficher l'utilisation de la mémoire. Utiliser True ou False dans Verbose, c'est indiquer si l'impression des informations complètes est facultative. Le cadre de données sera désormais affiché à l'aide de «PD. trame de données".

Ainsi, en utilisant la fonction «print ()», nous affichons l'instruction «Détail» à l'étape suivante. Ensuite, nous imprimons la fonction «DF.info (verbose = false) ". L'utilisation de cette fonction nous fournira un aperçu concis du code. Au lieu d'imprimer l'ensemble du cadre de données et de décriter son contenu, cette méthode a été utilisée pour expliquer le code de manière concise. Maintenant en utilisant df.info (verbose = false) »Il affichera simplement le« détail »et le décrira.

La sortie montre que le «détail» est assez concis et clair. Puisque nous avons utilisé «Verbose = true» dans l'exemple précédent, le résumé et le cadre de données du code ont été affichés; Cependant, nous avons utilisé Verbose = False dans ce domaine, il a donc affiché un résumé très court. En détail, il montre d'abord la «classe», qui est «Pandas.cœur.cadre.trame de données".

La «plage d'index» s'affiche dans la ligne suivante, qui est «3» indiquant que la plage d'entrées est de «0 à 2» puis, il indique alors le nombre de la colonne dans laquelle il y a trois colonnes; Peut-être que les types de données des données que nous avons dans le cadre de données sont présentés. «Float64 (1)», «int64 (1)», «int64 (1)» et objet (1) sont les types de données.

Un objet n'est pas un type de données, mais ici il est utilisé pour le caractère. La ligne suivante affiche l'utilisation de la mémoire, qui affiche la quantité de stockage qui est gratuite sur votre système en plus de la quantité de mémoire utilisée par tous les programmes ouverts, y compris Windows. La taille de l'utilisation de la mémoire est «200.0+ octets) ".

Conclusion

Nous avons parlé de la fonction info () dans cet article. La fonction d'information de Pandas décrit le cadre de données. Si nous devions résumer brièvement l'article dans le premier exemple, nous créons un cadre de données dans lequel nous prenons trois «entiers» de trois colonnes, «caractère» et «float_values». Nous avons quelques valeurs dans ces colonnes. Nous avons un index avec quatre entrées, allant de «0 à 3». En utilisant le «DF.Info.(Verbose = true) ”La fonction affichera soigneusement le résumé de la trame de données. Un cadre de données avec certaines colonnes est ce que nous avons dans le deuxième exemple. Il a trois entrées dans notre index, numérotée «0 à 2». La fonction «df.Info.(Verbose = false) »affichera un bref aperçu du code. Cet article peut vous rendre plus simple pour comprendre la méthode des informations du panda ().