Tutoriel Python Matplotlib

Tutoriel Python Matplotlib
Dans cette leçon sur la bibliothèque Python Matplotlib, nous examinerons divers aspects de cette bibliothèque de visualisation de données que nous pouvons utiliser avec Python pour générer des graphiques beaux et intuitifs qui peuvent visualiser les données sous une forme que l'entreprise souhaite à partir d'une plate-forme. Pour rendre cette leçon complète, nous couvrirons les sections suivantes:
  • Qu'est-ce que Python Matplotlib?
  • Types de parcelles que nous pouvons construire, comme le graphique à barres, l'histogramme, le tracé de dispersion, le tracé de la zone et le graphique PE
  • Travailler avec plusieurs parcelles
  • Quelques alternatives pour Python Matplotlib

Qu'est-ce que Python Matplotlib?

Le matplotlib.Pyplot est un package de tracé graphique qui peut être utilisé pour construire des graphiques bidimensionnels à l'aide du langage de programmation Python. En raison de sa nature enfichable, ce package peut être utilisé dans toutes les applications GUI, les serveurs d'applications Web ou les scripts Python simples. Certaines boîtes à outils qui étendent les fonctionnalités de Python Matplotlib sont:

  • Samelle de base est une bibliothèque de tracé de carte qui fournit des fonctionnalités pour créer des projets de carte, des côtes et des limites politiques
  • Natgride peut être utilisé pour griller des données irrégulières en données espacées
  • Outils Excel Peut être utilisé pour échanger des données entre MS Excel et Matplotlib
  • Cartopie est une bibliothèque de mappage beaucoup complexe qui fournit même des caractéristiques de transformation d'image en dehors des projections ponctuelles, lignes et polygones

Une note avant de commencer est que nous utilisons un environnement virtuel pour cette leçon que nous avons faite avec la commande suivante:

python -m virtualenv matplotlib
source matplotlib / bin / activer

Une fois que l'environnement virtuel est actif, nous pouvons installer la bibliothèque Matplotlib dans l'env virtual afin que les exemples que nous créons ensuite puissent être exécutés:

PIP installe Matplotlib

Nous voyons quelque chose comme ça lorsque nous exécutons la commande ci-dessus:

Vous pouvez également utiliser Anaconda pour exécuter ces exemples, ce qui est plus facile. Si vous souhaitez l'installer sur votre machine, regardez la leçon qui décrit «comment installer Anaconda Python sur Ubuntu 18.04 LTS »et partagez vos commentaires. Maintenant, passons à divers types de parcelles qui peuvent être construites avec Python Matplotlib.

Types de parcelles

Ici, nous démontrons les types de parcelles qui peuvent être dessinées avec Python Matplotlib.

Graphique simple

Le premier exemple que nous verrons sera d'un graphique simple. Cet exemple est utilisé comme une démonstration de la façon dont il est simple de construire un tracé de graphique ainsi que des personnalisations simples qui l'accompagnent. Nous commençons par importer Matplotlib et définissant les coordonnées x et y que nous voulons tracer:

de Matplotlib importe Pypllot comme plt
x = [3, 6, 9]
y = [2, 4, 6]

Après cela, nous pouvons tracer ces coordonnées sur le graphique et le montrer:

PLT.Terrain (x, y)
PLT.montrer()

Lorsque nous exécuterons ceci, nous verrons le graphique suivant:


Avec seulement quelques lignes de code, nous avons pu tracer un graphique. Ajoutons quelques personnalisations pour rendre ce graphique un peu plus expressif:

PLT.Titre ('LH Plot')
PLT.ylabel ('axe y)
PLT.xlabel ('x axe')

Ajoutez des lignes de code ci-dessus juste avant de montrer le tracé et le graphique aura désormais des étiquettes:

Nous allons donner une autre tentative de personnalisation de ce graphique pour le rendre intuitif avec les lignes de code suivantes avant de montrer l'intrigue:

x1 = [3, 6, 9]
y1 = [2, 4, 6]
x2 = [2, 7, 9]
y2 = [4, 5, 8]
PLT.titre ('info')
PLT.ylabel ('axe y)
PLT.xlabel ('x axe')
PLT.tracé (x1, y1, 'g', label = 'quart 1', linewidth = 5)
PLT.tracé (x2, y2, 'r', label = 'quart 2', linewidth = 5)
PLT.légende()
PLT.grille (vrai, color = 'k')
PLT.montrer()

Nous verrons le tracé suivant lorsque nous exécuterons l'extrait de code ci-dessus:

Remarquez avec quoi nous avons commencé et ce avec quoi nous nous sommes retrouvés, un graphique très intuitif et attrayant que vous pouvez utiliser dans vos présentations et il est fait avec du code python pur, certainement quelque chose dont vous êtes fier !

Faire un graphique à barres

Un graphique à barres est spécifiquement utile lorsque nous voulons plaguer une comparaison avec des mesures spécifiques et limitées. Par exemple, comparer les marques moyennes des étudiants avec une seule matière est un bon cas d'usage. Construisons un graphique à barres pour le même cas d'usage ici, l'extrait de code pour ce sera:

avg_marks = [81, 92, 55, 79]
physique = [68, 77, 62, 74]
PLT.bar ([0.25, 1.25, 2.25, 3.25], avg_marks, label = "moyen", largeur =.5)
PLT.bar([.75, 1.75, 2.75, 3.75], physique, label = "physique", color = 'r', largeur =.5)
PLT.légende()
PLT.xlabel ('gamme')
PLT.ylabel («marques»)
PLT.titre («comparaison»)
PLT.montrer()

Le graphique à barres créé avec les exemples de données ci-dessus ressemblera à ce qui suit:

Il y a plusieurs bars ici pour établir une comparaison. Veuillez noter que nous avons fourni la largeur de chaque barre en tant que premier paramètres et que la barre est décalée 0.5 valeurs de la précédente.

Nous pouvons combiner cette construction de graphiques de bar avec la bibliothèque Pandas pour le personnaliser davantage, mais nous le couvrirons dans une autre leçon sur les pandas.

Distributions avec des histogrammes

Les histogrammes sont souvent confondus avec les graphiques à barres. La différence la plus fondamentale réside dans leur cas d'utilisation. Les graphiques à barres sont utilisés pour établir des comparaisons entre les données tandis que les histogrammes sont utilisés pour décrire la distribution des données.

Par exemple, appliquons à nouveau l'exemple pour les marques des étudiants, mais cette fois, nous ne examinerons que les marques moyennes des étudiants et examinerons comment ils sont distribués. Voici l'extrait de code, très similaire à l'exemple précédent:

bacs = [0,10,20,30,40,50,60,70,80,90,100]
AVG_MARKS = [81, 77, 55, 88, 81, 66, 51, 66, 81, 92, 55, 51]
PLT.Hist (avg_marks, bacs, histtype = 'bar', rwidth = 0.8)
PLT.xlabel ('gamme')
PLT.ylabel («marques»)
PLT.titre («comparaison»)
PLT.montrer()

L'histogramme créé avec des données d'échantillons ci-dessus ressemblera à ce qui suit:

L'axe des y montrez ici combien d'étudiants ont obtenu les mêmes marques qui ont été fournies que les données de la construction.

Faire un complot de dispersion

Lorsqu'il s'agit de comparer plusieurs variables et d'établir leur effet les uns sur les autres, le tracé de dispersion est un bon moyen de présenter le même. En cela, les données sont représentées comme des points avec une valeur d'une variable reflétée par l'axe horizontal et la valeur de la deuxième variable détermine la position du point sur l'axe vertical.

Regardons un simple extrait de code pour décrire la même chose:

x = [1,1.5,2,2.5,3,3.5,3.6]
y = [75,8,85,9,95,10,75]
x1 = [8,8.5,9,9.5,10,10.5,11]
y1 = [3,35,3.7,4,45,5,52]
PLT.Scatter (x, y, label = '10 High Scoring Student ', Color =' R ')
PLT.disperser (x1, y1, label = '10 scoants à faible score ', color =' b ')
PLT.xlabel («marques»)
PLT.YLABEL («Count des étudiants»)
PLT.Titre ('Scatter Plot')
PLT.légende()
PLT.montrer()

Le tracé de dispersion créé avec des données d'échantillons ci-dessus ressemblera à ce qui suit:

Parcelles de zone

Les parcelles de zone sont utilisées principalement pour suivre les changements de données au fil du temps. Ils sont également appelés parcelles de pile dans divers textes. Par exemple, si nous voulons établir une représentation du temps investi par un étudiant dans chaque matière en une seule journée, voici le code avec lequel nous pouvons faire de même:

jours = [1,2,3,4,5]
physique = [2,8,6,5,7]
Python = [5,4,6,4,1]
r = [7,9,4,3,1]
math = [8,5,7,8,13]
PLT.tracé ([], [], color = 'm', label = 'physique', linewidth = 5)
PLT.tracé ([], [], color = 'c', label = 'python', linewidth = 5)
PLT.tracé ([], [], color = 'r', label = 'r', linewidth = 5)
PLT.tracé ([], [], color = 'k', label = 'math', linewidth = 5)
PLT.StackPlot (jours, physique, python, r, mathématiques, couleurs = ['g', 'k', 'r', 'b'])
PLT.xlabel ('x')
PLT.ylabel ('y')
PLT.Titre ('Stack Plot')
PLT.légende()
PLT.montrer()

Le tracé de zone créé avec des exemples de données ci-dessus ressemblera à ce qui suit:

La sortie ci-dessus établit clairement une différence de temps passé par un étudiant dans chaque sujet avec une manière claire de fournir la différence et la distribution.

Camemberts

Lorsque nous voulons diviser une partie entière en plusieurs parties et décrire la quantité que chaque pièce occupe, un graphique à tarte est un bon moyen de faire cette présentation. Il est utilisé pour montrer le pourcentage de données dans un ensemble de données complet. Voici un extrait de code de base pour créer un graphique à secteurs simple:

Labels = 'Python', 'C ++', 'Ruby', 'Java'
tailles = [225, 130, 245, 210]
couleurs = ['r', 'b', 'g', 'c']
exploser = (0.1, 0, 0, 0) # Explose de 1ère tranche
# Parcelle
PLT.tarte (tailles, explosage = explosage, étiquettes = étiquettes, couleurs = couleurs,
autopct = '% 1.1f %% ', shadow = true, startangle = 140)
PLT.axe («égal»)
PLT.montrer()

Le graphique à tarte créé avec des exemples de données ci-dessus ressemblera à ce qui suit:

Dans les sections ci-dessus, nous avons examiné divers composants graphiques que nous pouvons construire avec la bibliothèque Matplotlib pour représenter nos données sous diverses formes et établir des différences de manière intuitive tout en étant statistique.

Caractéristiques et alternatives pour Matplotlib

L'une des meilleures fonctionnalités pour Matplotlib est qu'elle peut fonctionner sur de nombreux systèmes d'exploitation et backends graphiques. Il prend en charge des dizaines de systèmes d'exploitation et de sortie graphique que nous avons examinés dans cette leçon. Cela signifie que nous pouvons compter sur lui lorsqu'il s'agit de fournir une sortie d'une manière dont nous avons besoin.

Il existe diverses autres bibliothèques qui peuvent rivaliser avec Matplotlib comme:

  1. Marin
  2. Tracer
  3. Ggplot2

Même si les bibliothèques mentionnées ci-dessus peuvent présenter des moyens avancés de décrire et de présenter des données de manière graphique, mais il n'y a pas de déni dans la simplicité et la nature efficace de la bibliothèque Matplotlib.

Conclusion

Dans cette leçon, nous avons examiné divers aspects de cette bibliothèque de visualisation de données que nous pouvons utiliser avec Python pour générer des graphiques beaux et intuitifs qui peuvent visualiser les données sous une forme que l'entreprise souhaite à partir d'une plate-forme. Le Matplotlib est l'une des bibliothèques de visualisation les plus importantes en ce qui concerne l'ingénierie des données et la présentation de données sous la plupart des formes visuelles, certainement une compétence que nous devons avoir sous notre actif.

Veuillez partager vos commentaires sur la leçon sur Twitter avec @sbmaggarwal et @linuxhint.