Histogramme de la série Pandas

Histogramme de la série Pandas

«La distribution de fréquence d'un réseau numérique est généralement représentée par un histogramme, qui est organisé en bacs de taille égale et égaux. La méthode «Pandas.Série.hist () »et« pandas.Série.Plot () ”sont tous deux largement utilisés. Ils peuvent être utilisés pour tracer rapidement les histogrammes en utilisant la série Pandas."

La Syntaxe «série.Hist () ”La méthode suit:

Syntaxe pour «série.Plot () ”Fonction:

Cet article démontrera la mise en œuvre de ces deux méthodes pour tracer les histogrammes.

Exemple n ° 1: utilisation de la série.Méthode hist () pour tracer un histogramme

Nous pouvons tracer une série Pandas en utilisant la série Pandas «Series.Méthode hist () ”. L'exécution pratique de cette technique peut être observée dans cette démonstration.

Nous avons intronisé l'outil «Spyder» pour compiler les programmes Python dans notre système. Le lancement de l'outil nous amène à l'interface. Par défaut, il ouvrira un fichier avec le nom «Temp.py ". Vous pouvez modifier le nom et «.py ”est l'extension des fichiers python.

Sur ce fichier Python, nous avons lancé le script en chargeant d'abord les packages nécessaires. La bibliothèque que nous avons importée dans notre environnement Python est les «pandas». Cette question pourrait se poser dans votre esprit, pourquoi importons-nous des pandas à partir du large éventail de packages que Python offre? Nous avons chargé cette boîte à outils car nous travaillerons sur le traçage des histogrammes avec la série Pandas.

Pour générer une série, nous utiliserons une méthode Pandas, «PD.Série () ”et pour tracer un histogramme de cette série, une autre méthode de pandas,« série.hist () »sera exercé dans ce guide. Nous avons donc importé des «pandas en tant que PD» dans notre fichier Python. Maintenant, nous allons passer au début du script.

Pour tracer les histogrammes de Pandas en utilisant une série, l'exigence initiale consiste à générer une série Pandas. Pour construire la série Pandas, le «PD.Série () ”La méthode est invoquée. Nous avons utilisé deux paramètres pour cette fonction: «Données» et «Nom». Les valeurs de la série seront contenues dans les «données», tandis que le nom de cette liste de valeurs est attribué au «nom». Les valeurs «données» tiennent «12, 32, 45, 65, 76, 32, 19, 34, 76, 89, 45, 35, 76, 89, 90, 44, 14, 33, 56, 69, 65 , 44, 36, 57, 23, 41, 78, 32, 47, 81 ”. Ainsi, notre série sera générée avec 30 valeurs. Nous avons nommé cette liste des «ventes». Le «PD.Série () ”Fonction construira la série avec des valeurs annexées, mais il n'a pas de stockage pour maintenir cette série pour une utilisation ultérieure.

Pour cela, nous avons créé un objet de série, le nommé «import_report», et lui avons attribué le résultat généré en invoquant le «PD.Méthode série () ”. La présentation de cette série nouvellement construite peut être rendue possible en utilisant la méthode «print ()» de Python. Cette méthode fonctionne en prenant toute sorte d'entrée et en la traitant pour montrer le résultat sur le terminal. Ici, nous avons utilisé le «.HEAD () ”Méthode avec le nom de la série car l'enregistrement stocké dans la série est trop long, nous avons donc préféré voir seulement quelques valeurs de départ. Le ".la méthode head () ”, par défaut, affiche les 5 premières entrées.

L'image ci-dessous présente une série rendue sur la fenêtre de sortie, ayant les 5 premières valeurs en cours de vue. Le nom de la liste est mentionné ci-dessous, et son type de données est également identifié comme «INT64».

Pour cartographier un histogramme d'une série Pandas, nous avons obtenu la série «série.hist () ”à partir de la boîte à outils Pandas. Cette méthode prend simplement les valeurs d'une série et trace un histogramme en les utilisant. Pour implémenter cette méthode, nous l'avons invoqué dans notre programme Python. Le nom de la série «import_report» est fourni avec le «.Méthode hist () ”. Ensuite, nous venons d'exécuter le programme en appuyant sur l'option «Exécuter le fichier».

Cela générera un tracé à l'écran, qui est affiché avec des barres. Les valeurs sur l'axe y sont de 0 à 8, ce qui représente la fréquence, tandis que l'axe x a des intervalles de 10 à 90.

Nous pouvons personnaliser cet histogramme en modifiant le nombre de bacs. Pour cela, nous avons un paramètre «bac». Nous avons passé ce paramètre à la «série.Fonction hist () ”. Les pandas créent des bacs par défaut, mais nous pouvons les modifier si nécessaire. Nous avons donc fourni aux «bacs» une valeur de «8». Il diffusera nos données en 8 bars dans l'histogramme.

Vous pouvez observer que le visuel précédent avait 10 bacs, mais celui-ci possède 8 bars.

Exemple n ° 2: utilisation de la série.Méthode de tracé () pour tracer un histogramme

L'autre technique que nous allons utiliser dans ce tutoriel est la série Pandas «.Plot () »Méthode. Par défaut, il crée un graphique en ligne, mais nous pouvons particulièrement spécifier le type de tracé que nous voulons visualiser nos données avec.

Le programme de cette méthode commence par importer la bibliothèque Pandas. Nous avons chargé le module Pandas et créé son alias comme «PD». Nous allons maintenant accéder à la méthode Pandas dont nous avons besoin en écrivant «PD» au lieu de «Pandas». La première méthode que nous avons invoquée à partir de la boîte à outils Pandas est le «PD.Série () ”pour la construction d'une série Pandas. Le «PD.Série () »La méthode est utilisée avec deux attributs,« données »et« nom ».

La liste des valeurs est stockée en «données» et le titre de la liste est défini en «nom». Les valeurs que nous avons fournies pour la création de la série sont «20, 34, 45, 67, 64, 78, 98, 72, 12, 34, 17, 92, 56, 77, 63, 37, 29, 11, 20, 80, 44, 21, 37, 65, 48, 88, 24, 37, 33, 19, 74, 26 ”. Le nombre total de valeurs stockées dans cette liste est de 32. Le nom que nous avons défini pour la liste des valeurs est des «valeurs». La série sera conservée dans un objet de série pour nous permettre de l'utiliser plus tard. Nous avons créé un objet de série, «My_Series», et l'avons attribué à la série nouvellement créée.

Comme la série que nous avons générée est très longue et ne peut pas être vue dans un seul instantané, nous avons donc décidé d'afficher uniquement les entrées initiales en exerçant la «série.HEAD () ”Méthode dans la fonction« print () ».

Le nom de la série, le type de données de la série et les valeurs de la série ont été présentés sur la console Python.

Nous allons maintenant utiliser cette série pour créer sa représentation visuelle à l'aide d'un intrigue.

Les séries.Plot () ”La méthode est invoquée. Ici, nous avons mentionné notre nom de série comme «My_Series» avec le «.Plot () ”Fonction. Entre les parenthèses de cette méthode, le paramètre «Kind» est utilisé. Cet attribut définira le type de tracé à éliminer. Comme nous voulons tracer un histogramme, nous avons spécifié le «genre» comme «hist».

Notre histogramme est généré à l'écran, qui contient 10 bacs pour la distribution des valeurs.

Nous pouvons changer le formatage de notre intrigue. Pour cela, nous avons créé un «conteneur» variable pour y sauver l'histogramme. Ensuite, nous avons utilisé le «set_xLabe () l» pour identifier une étiquette «liste de valeurs» qui sera affichée sur l'axe des X. De plus, pour définir l'étiquette de l'histogramme, nous avons utilisé la méthode «set_title ()» pour titre un intrigue comme «Ceci est notre intrigue de démonstration».

Vous pouvez voir les résultats dans le tracé d'histogramme visuel présenté ci-dessous.

Conclusion

Visualiser une série de données en créant des parcelles est une technique très utile pour l'analyse des données rapide. Cette leçon vous a présenté les deux méthodes pour tracer l'histogramme en utilisant la série Pandas. La première technique dont nous avons discuté est la «série.Hist () ”Méthode, qui explore également le concept de modification des bacs. La deuxième fonction exercée est la «série.Plot () »Méthode. Dans cette technique, nous avons appris à modifier le formatage de l'intrigue en fonction de nos besoins.