Histogramme de dateframe de Pandas

Histogramme de dateframe de Pandas
Nous pouvons faire de DataFrame contenant différents champs et lignes en pandas. Les données sont insérées dans ces lignes et colonnes. Nous pouvons dessiner «l'histogramme» de la dataframe en pandas. Un «histogramme» est fréquemment utilisé pour montrer comment les données numériques sont distribuées. Vous souhaiterez fréquemment comprendre rapidement comment les variables numériques spécifiques sont distribuées dans un ensemble de données lors de l'étude. Un histogramme est utilisé pour le faire. Pandas fournit la méthode «hist ()» pour dessiner l'histogramme.

Les pandas.Trame de données.La technique HIST () est utilisée pour déterminer comment les variables numériques sont distribuées. Les valeurs sont divisées en variables numériques par cette fonction. Son objectif principal est de créer un histogramme à partir d'un dataframe spécifié. Lorsque les pandas dataframe.La méthode HIST () est utilisée, chaque série de la dataframe spécifiée est automatiquement transmise au matplotlib. pypllot.Méthode hist (). En retour, nous obtenons un histogramme pour chaque colonne. Nous allons tracer l'histogramme de DataFrame dans ce guide en utilisant la méthode «Hist ()» de Pandas.

Syntaxe:

Trame de données.hist (data, colonne = aucun, by = non, grid = true, xLabelSize = non, xrot = non, yLabelSize = non, yrot = non, ax = non, sharex = false, sharey = false, figsize = non, disposition = Aucun, bacs = 10, backend = aucun, légende = false, ** kwargs)

Exemple 1:

Les codes Pandas de ce guide sont effectués sur l'outil «Spyder». Dans la première ligne, nous importons les «Pandas en tant que PD». Ensuite, nous créons un dataframe de «valeurs» en utilisant le «PD.Méthode DataFrame () ». Nous développons deux colonnes des «valeurs» de données de données qui sont «longueur l» et «largeur B». Et nous mettons les valeurs numériques dans chacun d'eux. Dans «Longueur L», nous insérons «2.7, 8.7, 3.4, 2.4, et 1.Valeur numérique 9 ”. Pendant que dans «Largeth B», nous insérons «4.24, 2.67, 7.6, 7.1 et 4.Vlaues numériques 9 ”. Maintenant, nous dessinons l'histogramme de ces données du dataframe. Nous initialisons la variable «Hist» avec le «DataFrame.Hist () ”Méthode et insérer les« bacs = 6 ».

Un histogramme évalue le nombre de mesures qui se produisent à travers chaque bac après avoir divisé les valeurs contenues dans une variable numérique en «bacs."Nous pouvons rapidement et facilement une compréhension instinctive de la distribution des valeurs à l'intérieur d'une variable en représentant visuellement ces dénombrements de bac d'une manière en colonne.


Cette sortie apparaît sur la console Spyder lorsque nous appuyons sur les touches «Shift + Entrée» sur le clavier. Ici, nous avons deux histogrammes. Ce sont les histogrammes de ces données que nous avons insérées dans le code Pandas.

Exemple 2:

Nous générons ici les «valeurs» qui contient trois colonnes qui sont «B_1, H_1 et L_1» qui montrent respectivement la largeur, la hauteur et la longueur. Nous ajoutons «4.24, 2.67, 7.6, 7.1 et 4.9 ”dans" b_1 ". Nous ajoutons également «6 6.8, 5.5, 4.8, 11.88, et 1.1 "dans" H_1 ". Ensuite, nous insérons «3.7, 9.7, 3.4, 4.4, et 2.9 ”dans" L_1 ". Après cela, nous utilisons la méthode «hist ()» qui convertit ces valeurs numériques en un histogramme. Il dessine trois histogrammes distincts. La valeur «bacs» que nous définissons ici est «12».


Trois graphiques d'histogramme différents apparaissent dans la sortie. Le premier histogramme est des données "B_1", le deuxième tableau d'histogramme est des données "H_1", et la dernière est des données "L_1".

Exemple 3:

Maintenant, nous dessinons quatre histogrammes distincts dans cet exemple. Pour cela, nous créons quatre colonnes du DataFrame comme «Données 1, données 2, données 3 et données 4». Dans «Data 1», nous ajoutons quelques valeurs qui sont «2.7, 0.0, 1.4, 2.4, et 1.9 ”. Nous placons «4.24, 2.67, 7.6, 7.1 et 4.9 ”dans« Data 2 ». Ajouter «5.8, 5.5, 7.8, 10.88, et 0.1 ”à« Données 3 ». Et ajouter les valeurs «20, 40.8, 55.8, 7.2 et 48 ”dans« Data 4 ». Après cela, nous dessinons séparément l'histogramme de toutes ces colonnes. Nous utilisons la technique «hist ()» avec le nom du DataFrame et définissons ses «bacs» comme «8». Il génère quatre histogrammes distincts sur l'écran de sortie.


Nous avons créé ces histogrammes donnés à l'aide de la fonction «Hist ()» dans Pandas. Toutes les colonnes contiennent des données différentes, donc les quatre histogrammes ici sont différents les uns des autres.

Exemple 4:

Nous pouvons également dessiner l'histogramme de ces données qui sont présentes dans le fichier CSV. Maintenant, dans cet exemple, nous tracons les histogrammes des données du fichier CSV. Pour cela, nous importons le «Matplotlib.bibliothèque pyplot ”comme« PLT ». Nous obtenons les fonctions de cette bibliothèque en mettant l'objet «PLT» au lieu du «Matplotlib.pypllot ". Maintenant, nous lisons le fichier CSV en utilisant la méthode "read_csv". Nous spécifions le nom du fichier qui contient les données que nous souhaitons importer dans un dataframe dans le "read_csv ()".

Ici, le fichier s'appelle «Fichier.CSV ". Les données du «fichier.CSV "est stocké dans le" DF "sous la forme de DataFrame. Nous rendons les données du fichier sous forme de dataframe sur la console. Ensuite, nous appliquons la méthode «hist ()» dans laquelle nous plaçons le nom de la colonne présente dans le fichier CSV. Ce nom de colonne est "S_NAME". Lorsque les histogrammes sont créés, ce nom y apparaît. La «Figse» que nous utilisons ici est utilisée pour ajuster la taille de l'image histogramme que nous définissons comme «12» pour la «largeur» et «8» pour la «hauteur» de la taille du graphique de l'histogramme.

De plus, les «bacs» sont définis sur «15». En fin de compte, nous plaçons le «PLT.Méthode show () ”. Le «PLT. show () ”La méthode lance une boucle d'événement, recherche toutes les entités de figure existantes et lance plusieurs fenêtres interactives qui démontrent votre graphique ou vos graphiques.


Ici, il affiche d'abord les données qui sont présentes dans le fichier CSV sous la forme de DataFrame. Ensuite, il trace séparément les graphiques des données numériques pour chaque.


Vous verrez que nous avons six graphiques distincts ici. Les noms d'étudiants sont mentionnés sur chaque graphique car nous avons ajusté ce «s_name» dans le code. Ainsi, ce "S_Name" est rendu ici au-dessus de chaque graphique.

Exemple 5:

Nous importons à nouveau les deux bibliothèques qui sont des «pandas» et «matplotlib.pyplot »dans ce code comme« pd »et« plt », respectivement. Ensuite, nous dessinons l'histogramme du «Bureau.Fichier CSV "en plaçant d'abord la méthode" read_csv () ", puis en utilisant la fonction simple" hist () ". De plus, nous affichons les données du fichier Office en tant que DataFrame sur le terminal avant d'utiliser la méthode «Hist ()». Nous ajoutons le «PLT. show () ”Fonction que nous avons expliquée dans l'exemple précédent.


Le dataframe du «bureau.Le fichier CSV »est rendu. Leurs histogrammes sont affichés dans l'illustration suivante. Ici, les données du fichier CSV sont d'abord affichées sous la forme d'un dataframe.


Deux graphiques d'histogramme sont affichés dans la sortie car ce DataFrame ne contient que deux colonnes qui ont les données numériques,.

Exemple 6:

Ceci est notre dernier exemple pour ce guide. Nous créons les données «CARS_DF» et y insérons deux colonnes. Le «nom de voiture» contient les noms des voitures et le «prix du challan» contient le prix du challan. Après cela, nous accédons à la fonction «Hist ()» à partir du «PLT» qui est la bibliothèque que nous importons au début du code. Nous passons le nom de la colonne «Challan_price» dans le «PLT. Hist () ”Fonctionne et utilisez le« PLT. Méthode show () ”.


Ceci est le tableau d'histogramme de ce code qui est dessiné en fonction des valeurs numériques présentes dans la colonne "Challan_price".

Conclusion

La méthode «Hist ()» en pandas est démontrée dans ce guide. Notre objectif principal est de transmettre l'idée de la méthode «hist ()» dans les pandas simplement et succinctement. Nous avons expliqué comment utiliser la fonction Pandas «HIST ()» pour dessiner l'histogramme des données numériques du dataframe. Nous avons expliqué que «l'histogramme» est une représentation visuelle sur la façon dont les données sont distribuées. Vous pourrez passer à une étape plus compliquée de la programmation Pandas après avoir lu ce guide. Nous espérons que vous bénéficierez grandement à l'avenir de ce guide.