Comment tracer des données dans Pandas Python

Comment tracer des données dans Pandas Python
La visualisation des données joue un rôle important dans l'analyse des données. Pandas est une solide bibliothèque d'analyse de données dans Python pour la science des données. Il fournit diverses options pour la visualisation des données avec .Plot () Méthode. Même si vous êtes un débutant, vous pouvez facilement tracer vos données à l'aide de la bibliothèque Pandas. Vous devez importer les pandas et le matplotlib.package pyplot pour la visualisation des données.

Dans cet article, nous explorerons diverses méthodes de traçage de données en utilisant le Pandas Python. Nous avons exécuté tous les exemples sur l'éditeur de code source PyCharm en utilisant le matplotlib.package pypllot.

Tracer dans Pandas Python

En pandas, le .Plot () a plusieurs paramètres que vous pouvez utiliser en fonction de vos besoins. Surtout, en utilisant le paramètre «Kind», vous pouvez définir le type de tracé que vous allez créer.

La syntaxe pour tracer des données à l'aide de Pandas Python

La syntaxe suivante est utilisée pour tracer un DataFrame dans Pandas Python:

# Importer des pandas et du matplotlib.packages pypllot
Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
# Préparer des données pour créer des données
data_frame =
'Column1': ['field1', 'field2', 'field3', 'field4',…],
'Column2': ['field1', 'field2', 'field3', 'field4',…]

var_df = pd.DataFrame (data_frame, colonnes = ['Column1', 'Column2])
Imprimer (variable)
# Graphique de la barre de traçage
var_df.parcelle.bar (x = 'chronn1', y = 'chronn2')
PLT.montrer()

Vous pouvez également définir le type de tracé en utilisant le paramètre de type comme suit:

var_df.tracé (x = 'chronn1', y = 'chronn2', kind = 'bar')

Les objets Pandas DataFrames ont les méthodes de tracé suivantes pour le traçage:

  • PROSITION DU PROCHAGE: parcelle.dispersion()
  • Complot de bar: parcelle.bar (), tracé.Barh () où H représente le tracé des barres horizontales.
  • Tracé de ligne: parcelle.doubler()
  • Plotage à tarte: parcelle.tarte()

Si un utilisateur utilise uniquement la méthode de tracé () sans utiliser de paramètre, il crée le graphique de ligne par défaut.

Nous allons maintenant développer certains types de traçage en détail avec l'aide de quelques exemples.

Répartir le traçage en pandas

Dans ce type de complot, nous avons représenté la relation entre deux variables. Prenons un exemple.

Exemple

Par exemple, nous avons des données de corrélation entre deux variables GDP_GROWth et Oil_Price. Pour tracer la relation entre deux variables, nous avons exécuté le morceau de code suivant sur notre éditeur de code source:

Importer Matplotlib.pypllot comme plt
Importer des pandas en tant que PD
gdp_cal = pd.Trame de données(
«GDP_GROWTH»: [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Oil_price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (GDP_CAL, Columns = ['Oil_price', 'GDP_GROWTH'])
Imprimer (DF)
df.tracé (x = 'huile_price', y = 'gdp_growth', kind = 'dissat', color = 'red')
PLT.montrer()

Les graphiques de ligne complotent en pandas

Le tracé du graphique de ligne est un type de traçage de base dans lequel les informations données s'affichent dans une série de points de données qui sont davantage connectées par des segments de lignes droites. À l'aide des graphiques de ligne, vous pouvez également afficher les tendances des heures supplémentaires.

Exemple

Dans l'exemple mentionné ci-dessous, nous avons pris les données sur le taux d'inflation de l'année écoulée. Tout d'abord, préparez les données, puis créez des données. Le code source suivant trace le graphique de ligne des données disponibles:

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
inf_cal = 'année': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inf_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, colonnes = ['année', 'inf_rate']))
trame de données.tracé (x = 'année', y = 'inf_rate', kind = 'line')
PLT.montrer()

Dans l'exemple ci-dessus, vous devez définir la gamme Kind = 'Line' pour le traçage du graphique de ligne.

Méthode 2 # Utilisation du tracé.Méthode line ()

L'exemple ci-dessus, vous pouvez également implémenter en utilisant la méthode suivante:

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
inf_cal = 'année': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, colonnes = ['inflation_rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011]))
trame de données.parcelle.doubler()
PLT.Titre («Résumé du taux d'inflation des 11 dernières années»)
PLT.ylabel ('inflation_rate')
PLT.xlabel ('année')
PLT.montrer()

Le graphique de ligne suivant s'affiche après l'exécution du code ci-dessus:

Graphique à barres Tableau en pandas

Le tracé du graphique à barres est utilisé pour représenter les données catégorielles. Dans ce type de parcelle, les barres rectangulaires avec différentes hauteurs sont tracées en fonction des informations données. Le graphique à barres peut être tracé dans deux directions horizontales ou verticales différentes.

Exemple

Nous avons pris le taux d'alphabétisation de plusieurs pays dans l'exemple suivant. Les dataframes sont créés dans lesquels «country_name» et «littéracy_rate» sont les deux colonnes d'un dataframe. À l'aide de pandas, vous pouvez tracer les informations dans la forme du graphique de la barre comme suit:

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
lit_cal =
«Country_Names»: [«Pakistan», «USA», «Chine», «Inde», «UK», «Autriche», «Égypte», «Ukraine», «Saudia», «Australie»,
'Malaisie'],
'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (litt_cal, colonnes = ['country_names', 'litr_rate'])
print (data_frame)
trame de données.parcelle.bar (x = 'country_names', y = 'litr_rate')
PLT.montrer()

Vous pouvez également implémenter l'exemple ci-dessus en utilisant la méthode suivante. Définissez le tracé KINT = "BAR" pour le graphique à barres dans cette ligne:

trame de données.tracé (x = 'country_names', y = 'litr_rate', kind = 'bar')
PLT.montrer()

Tracé du graphique à barre horizontal

Vous pouvez également tracer les données sur les barres horizontales en exécutant le code suivant:

Importer Matplotlib.pypllot comme plt
Importer des pandas en tant que PD
data_chart = 'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (Data_Chart, Columns = ['litr_rate'], index = ['Pakistan', 'USA', 'China', 'India', 'UK', 'Autriche', 'Egypt', 'Ukraine', 'Saudia' , «Australie»,
'Malaisie'])
df.parcelle.Barh ()
PLT.titre («taux d'alphabétisation dans divers pays»)
PLT.ylabel ('country_name')
PLT.xlabel ('litr_rate')
PLT.montrer()

En df.parcelle.Barh (), le Barh est utilisé pour le traçage horizontal. Après avoir exécuté le code ci-dessus, le graphique à barres suivant s'affiche sur la fenêtre:

Tarte à tarte Tableau en pandas

Un graphique à tarte représente les données sous une forme graphique circulaire dans laquelle les données s'affichent en tranches en fonction de la quantité donnée.

Exemple

Dans l'exemple suivant, nous avons affiché les informations sur «Earth_Material» en différentes tranches sur le graphique à tarte. Créez d'abord le DataFrame, puis, en utilisant les pandas, affichez tous les détails du graphique.

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
matériel_per = 'Earth_Part': [71,18,7,4]
dataframe = pd.DataFrame (Material_per, Columns = ['Earth_Part'], index = ['Water', 'Mineral', 'Sand', 'Metals'])
trame de données.parcelle.Pie (y = 'Earth_Part', FigSize = (7, 7), autopct = '% 1.1f %% ', startangle = 90)
PLT.montrer()

Le code source ci-dessus trace le graphique à tarte des données disponibles:

Conclusion

Dans cet article, vous avez vu comment tracer des dataframes dans Pandas Python. Différents types de complots sont réalisés dans l'article ci-dessus. Pour tracer plus de types tels que Box, Hexbin, Hist, KDE, densité, zone, etc., Vous pouvez utiliser le même code source simplement en modifiant le type de tracé.