Matplotlib Scatter Plot in Python

Matplotlib Scatter Plot in Python
L'humain peut comprendre davantage le visuel par rapport à la forme de texte. C'est pourquoi les gens suggèrent toujours de dessiner le graphique de Big Data pour le comprendre d'une manière très facile. Il existe différents types de graphiques disponibles sur le marché comme des graphiques à barres, des histogrammes, des graphiques à tarte, etc. Ces différents graphiques sont utilisés en fonction de l'ensemble de données et des exigences. Par exemple, si vous avez un ensemble de données sur les performances de l'entreprise des 10 dernières années, le graphique à barres donnera plus d'informations sur la croissance de l'entreprise. Donc, comme ça, le choix du graphique dépend de l'ensemble de données et des exigences.

Si vous êtes un scientifique des données, alors vous devez parfois gérer le Big Data. Dans ce Big Data, vous traitez les données, analysez les données, puis générez le rapport à ce sujet. Pour générer le rapport à ce sujet, vous devez avoir besoin d'une image claire des données, et ici les graphiques entrent en place.

Dans cet article, nous allons expliquer comment utiliser le Matplotlib Scatter Plot in Python.

Le Plot de dispersion est largement utilisé par l'analyse des données pour découvrir la relation entre deux ensembles de données numériques. Cet article verra comment utiliser le matplotlib.pypllot pour dessiner un tracé de dispersion. Cet article vous donnera des détails complets que vous devez travailler sur l'intrigue de dispersion.

Le matplotlib.Pypolt offre différentes façons de tracer le graphique. Pour tracer le graphique sous forme de dispersion, nous utilisons la fonction diffusée ().

La syntaxe pour utiliser la fonction Scatter () est:

matplotlib.pypllot.Scatter (x_data, y_data, s, c, marqueur, cmap, vmin, vmax, alpha, linewidths, edgecolors)

Tous les paramètres ci-dessus, nous verrons dans les prochains exemples pour mieux comprendre.

Importer Matplotlib.pypllot comme plt
PLT.disperser (x_data, y_data)

Les données que nous avons transmises sur la dispersion X_DATA appartiennent à l'axe X, et Y_DATA appartient à l'axe Y.

Exemples

Maintenant, nous allons tracer le graphique Scatter () en utilisant différents paramètres.

Exemple 1: en utilisant les paramètres par défaut

Le premier exemple est basé sur les paramètres par défaut de la fonction dispersion (). Nous passons simplement deux ensembles de données pour créer une relation entre eux. Ici, nous avons deux listes: l'une appartient aux hauteurs (H), et une autre correspond à leurs poids (W).

# dispers_default_arguments.py
# Importer la bibliothèque requise
Importer Matplotlib.pypllot comme plt
# h (hauteur) et w (poids) données
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# tracé un tracé de dispersion
PLT.dispersion (h, w)
PLT.montrer()

Sortir: dispers_default_arguments.py

Dans la sortie ci-dessus, nous pouvons voir les poids (w) des données sur l'axe et les hauteurs (H) sur l'axe des x.

Exemple 2: Plot Scatter () avec leurs valeurs d'étiquettes (axe x et axe y) et titre

Dans l'exemple_1, nous dessinons simplement le tracé de dispersion directement avec les paramètres par défaut. Maintenant, nous allons personnaliser la fonction de tracé de dispersion une par une. Donc, tout d'abord, nous ajouterons des étiquettes à l'intrigue, comme indiqué ci-dessous.

# étiquettes_title_scatter_plot.py
# Importer la bibliothèque requise
Importer Matplotlib.pypllot comme plt
Données # H et W
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# tracé un tracé de dispersion
PLT.dispersion (h, w)
# Définissez les noms des axes
PLT.xlabel ("poids (w) en kg")
PLT.ylabel ("hauteur (h) en cm")
# Définissez le titre du nom du graphique
PLT.Titre ("Plot de dispersion pour la taille et le poids")
PLT.montrer()

Ligne 4 à 11: Nous importons la bibliothèque matplotlib.pypllot et créez deux ensembles de données pour l'axe X et l'axe y. Et nous passons les deux ensembles de données à la fonction de tracé de dispersion.

Ligne 14 à 19: Nous définissons les noms d'étiquette de l'axe X et de l'axe y. Nous avons également défini le titre du graphique de tracé à disperser.

Sortir: libels_title_scatter_plot.py

Dans la sortie ci-dessus, nous pouvons voir que le tracé de dispersion a des noms d'étiquette d'axe et le titre de tracé de dispersion.

Exemple 3: Utilisez le paramètre du marqueur pour modifier le style des points de données

Par défaut, le marqueur est un tour solide, comme le montre la sortie ci-dessus. Donc, si nous voulons changer le style du marqueur, nous pouvons le changer via ce paramètre (marqueur). Même nous pouvons également régler la taille du marqueur. Donc, nous allons voir à ce sujet dans cet exemple.

# marker_scatter_plot.py
# Importer la bibliothèque requise
Importer Matplotlib.pypllot comme plt
Données # H et W
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# tracé un tracé de dispersion
PLT.Scatter (H, W, Marker = "V", S = 75)
# Définissez les noms des axes
PLT.xlabel ("poids (w) en kg")
PLT.ylabel ("hauteur (h) en cm")
# Définissez le titre du nom du graphique
PLT.Titre ("Prappe de dispersion où le marqueur change")
PLT.montrer()

Le code ci-dessus est le même que celui expliqué dans les exemples précédents, à l'exception de la ligne ci-dessous.

Ligne 11: Nous passons le paramètre du marqueur et un nouveau signe utilisé par le tracé de dispersion pour dessiner des points sur le graphique. Nous avons également réglé la taille du marqueur.

La sortie ci-dessous montre des points de données avec le même marqueur que nous avons ajouté dans la fonction de diffusion.

Sortir: Marker_scatter_plot.py

Exemple 4: Modifiez la couleur du tracé de dispersion

Nous pouvons également modifier la couleur des points de données en fonction de notre choix. Par défaut, il se manifeste avec une couleur bleue. Maintenant, nous allons changer la couleur des points de données de la tracé de dispersion, comme indiqué ci-dessous. Nous pouvons changer la couleur du tracé de dispersion en utilisant la couleur que vous souhaitez. Nous pouvons choisir n'importe quel tuple RGB ou RGBA (rouge, vert, bleu, alpha). La plage de valeur de chaque élément de tuple sera entre [0.0, 1.0], et nous pouvons également représenter le RGB ou le RGBA au format hexadécimal comme # FF5733.

# dispers_plot_colour.py
# Importer la bibliothèque requise
Importer Matplotlib.pypllot comme plt
Données # H et W
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# tracé un tracé de dispersion
PLT.disperser (h, w, marker = "v", s = 75, c = "rouge")
# Définissez les noms des axes
PLT.xlabel ("poids (w) en kg")
PLT.ylabel ("hauteur (h) en cm")
# Définissez le titre du nom du graphique
PLT.Titre ("Scatter Plot Color Change")
PLT.montrer()

Ce code est similaire aux exemples précédents, sauf la ligne ci-dessous où nous ajoutons la personnalisation des couleurs.

Ligne 11: Nous passons le paramètre «C», qui est pour la couleur. Nous avons attribué le nom de la couleur «rouge» et avons obtenu la sortie dans la même couleur.

Si vous aimez utiliser le tuple de couleur ou l'hexadécimal, alors transmettez simplement cette valeur au mot-clé (C ou couleur) comme ci-dessous:

PLT.Scatter (H, W, Marker = "V", S = 75, C = "# FF5733")

Dans la fonction de dispersion ci-dessus, nous avons passé le code couleur hexadécimal au lieu du nom de couleur.

Sortir: dispers_plot_colour.py

Exemple 5: Changement de couleur de la parcelle de dispersion en fonction de la catégorie

Nous pouvons également modifier la couleur des points de données en fonction de la catégorie. Donc, dans cet exemple, nous allons expliquer que.

# colour_change_by_category.py
# Importer la bibliothèque requise
Importer Matplotlib.pypllot comme plt
Les données # H et W se rassemblent à partir de deux pays
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Définissez le nom du pays 1 ou 2 qui montre la taille ou le poids
# Les données appartiennent à quel pays
country_category = ['country_2', 'country_2', 'country_1',
'country_1', 'country_1', 'country_1',
'country_2', 'country_2', 'country_1', 'country_2']
# mappage de couleurs
couleurs = 'country_1': 'orange', 'country_2': 'bleu'
colour_list = [couleurs [i] pour i dans country_category]
# Imprimez la liste des couleurs
print (colour_list)
# tracé un tracé de dispersion
PLT.Scatter (H, W, Marker = "V", S = 75, C = Colour_List)
# Définissez les noms des axes
PLT.xlabel ("poids (w) en kg")
PLT.ylabel ("hauteur (h) en cm")
# Définissez le titre du nom du graphique
PLT.Titre ("Scatter Plot Color Change pour la catégorie")
PLT.montrer()

Le code ci-dessus est similaire aux exemples précédents. Les lignes où nous avons effectué des modifications sont expliquées ci-dessous:

Ligne 12: Nous mettons tous les points de données dans la catégorie de country_1 ou country_2. Ce ne sont que des hypothèses et non la vraie valeur pour montrer la démo.

Ligne 17: Nous avons créé un dictionnaire de la couleur qui représente chaque catégorie.

Ligne 18: Nous mappes la catégorie du pays avec leur nom de couleur. Et l'instruction I-ci-dessous affichera des résultats comme celui-ci.

[«bleu», «bleu», «orange», «orange», «orange», «orange», «bleu», «bleu», «orange», «bleu»]

Ligne 24: Enfin, nous passons la colour_list (ligne 18) à la fonction de diffusion.

Sortir: colour_change_by_category.py

Exemple 6: Modifiez la couleur du bord du point de données

Nous pouvons également modifier la couleur du bord du point de données. Pour cela, nous devons utiliser le mot-clé Edge Color («Edgecolor»). Nous pouvons également régler la largeur de ligne du bord. Dans les exemples précédents, nous n'avons utilisé aucun Edgecolor, qui est par défaut. Donc, il ne montre aucune couleur par défaut. Nous allons ajouter une couleur de bord sur le point de données pour voir la différence entre le graphique de tracé de dispersion des exemples précédents avec le graphique des points de données de couleur de bord de bord.

# EDGECOLOUR_SCATTERPLOT.py
# Importer la bibliothèque requise
Importer Matplotlib.pypllot comme plt
Données # H et W
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# tracé un tracé de dispersion
PLT.Scatter (H, W, Marker = "V", S = 75, C = "Red", EdgeColor = 'Black', LineWidth = 1)
# Définissez les noms des axes
PLT.xlabel ("poids (w) en kg")
PLT.ylabel ("hauteur (h) en cm")
# Définissez le titre du nom du graphique
PLT.Titre ("Scatter Plot Color Change")
PLT.montrer()

Ligne 11: Dans cette ligne, nous ajoutons simplement un autre paramètre que nous appelons Edgecolor et Linewidth. Après avoir ajouté les deux paramètres, maintenant notre graphique de tracé de dispersion ressemble à quelque chose, comme indiqué ci-dessous. Vous pouvez voir que l'extérieur du point de données est désormais bordé avec la couleur noire avec LineWidth = 1.

Sortir: EDGECOLOUR_SCATTERPLOT.py

Conclusion

Dans cet article, nous avons vu comment utiliser la fonction de tracé de dispersion. Nous avons expliqué tous les principaux concepts nécessaires pour dessiner un tracé de dispersion. Il pourrait y avoir une autre façon de dessiner le tracé de dispersion, comme un moyen plus attrayant, selon la façon dont nous utilisons différents paramètres. Mais la plupart des paramètres que nous avons couverts devaient dessiner l'intrigue plus professionnellement. De plus, n'utilisez pas trop de paramètres complexes, ce qui peut confondre la signification réelle du graphique.

Le code de cet article est disponible sur le lien GitHub ci-dessous:

https: // github.com / shekharpandey89 / dispersion-plot-matplotlib.pypllot