Seaborn Plot Dataframe

Ethan Guillot

«Seaborn aide à l'exploration et à la compréhension des données. Ses fonctions de cartographie fonctionnent avec les cadres de données et les tableaux contenant des ensembles de données entiers, effectuant l'agrégation statistique requise et la cartographie sémantique en interne pour créer des graphiques utiles. Les associations statistiques peuvent être vues à l'aide de SeaBorn. Une analyse statistique est utilisée pour déterminer comment les paramètres d'un ensemble de données se rapportent et comment cette connexion est influencée par d'autres variables. Cette analyse statistique aide à la visualisation des tendances ainsi qu'à l'identification de diverses fonctionnalités dans l'ensemble de données.

Par défaut, Pandas DataFrame est utilisé pour charger l'ensemble de données. Ce dataframe est utilisé par n'importe quelle fonction Pandas Dataframe. Les dataframes sont des grilles rectangulaires qui contiennent des données et permettent une visualisation facile des données. Chaque colonne du motif de la grille est un vecteur qui conserve les données pour une seule variable, et chaque ligne de la grille a des valeurs d'une instance. Cela signifie que les valeurs dans les lignes d'un dataframe ne doivent pas être du même type de données; Ils peuvent être arithmétiques, texte, logiques ou quoi que ce soit d'autre. DataFrames sont des conteneurs de données annotés bidimensionnels avec divers types de colonnes qui sont emballées avec le module Pandas pour Python.

La bibliothèque de SeaBorn comprend quelques ensembles de données clés. Les ensembles de données se téléchargent automatiquement après l'installation de SeaBorn. L'ensemble de données nécessaire peut être chargé avec l'aide de la fonction suivante.

load_dataset ()

Cette fonction vous donne un accès rapide à un nombre limité d'échantillons de données que vous pouvez utiliser pour documenter SeaBorn ou créer des exemples reproductibles pour les rapports de bogues. L'utilisation normale ne le nécessite pas."

Exemple 1

Dans notre premier exemple, nous utilisons le tracé de la boîte pour imaginer les enregistrements. Nous avons des modules SeaBorn et Matplotlib pour tracer le tracé de ligne. Ensuite, une variable est déclarée comme des données, et à l'intérieur de cette variable, le Seaborn Load_dataset est appelé. Le load_dataset prend le cadre de données TIPS, qui est par défaut présent dans Python. Maintenant, nous pouvons appeler l'une des colonnes de l'ensemble de données Titanic pour le rendu de l'intrigue. Le tracé de la boîte prend X comme un argument auquel nous avons défini la colonne Total_bill à partir de l'échantillon de jeu de données Titanic.

Importer Seaborn comme SNS
Importer Matplotlib.pypllot comme plt
données = SNS.load_dataset ("conseils")
sns.boxplot (data ['total_bill'])
PLT.montrer()

Le Titanic Data Frame Boxplot est visualisé dans la figure suivante.

Exemple 2

Nous pouvons tracer le cadre de données avec l'une des parcelles de Seaborn. Dans cet exemple, nous avons un terrain de violon pour fabriquer le tracé du cadre de données Seaborn. Une parcelle de boîte et une parcelle de violon sont comparables. Il compare les distributions de nombreux points de données quantitatifs entre un ou plusieurs facteurs de catégorie.

Comme nous utilisons la fonction SeaBorn Load_dataset, nous devons donc importer le module Python Seaborn, et pour l'intrigue, nous avons un module Matplotlib. Là, nous stylissons l'arrière-plan de l'intrigue à une grille sombre. Ensuite, la fonction LOAD_DATASET est appelée, où encore une fois, nous avons utilisé les exemples de conseils de jeu de données.

À partir des exemples de conseils d'ensemble de données, nous prenons deux colonnes, total_bill et temps, pour les axes x et y du tracé. Pour utiliser ces colonnes pour l'intrigue, nous avons un tracé de violon à Seaorn ici qui prend le X en tant que total_bill pour l'axe et y comme temps pour l'axe y. Ces colonnes spécifiées sont comparées les unes avec les autres dans le tracé.

Importer Seaborn comme SNS
Importer Matplotlib.pypllot comme plt
sns.set (style = 'darkgrid')
DF = SNS.load_dataset ("conseils")
sns.violinplot (x = "total_bill", y = "time", data = df)
PLT.montrer()

Le cadre de données est visualisé dans la figure suivante.

Exemple 3

Ici, nous avons montré le tracé DataFrame avec le tracé de points. Un tracé ponctuel peut indiquer l'estimation avec des intervalles de confiance en utilisant des graphiques de tracé de dispersion. Le point détermine une signification statistique estimée pour un point de données basé sur l'emplacement de point du tracé de dispersion et comprend des barres d'erreur pour indiquer le niveau d'incertitude.

Dans le script suivant, nous avons défini la grille sombre de style pour l'arrière-plan de l'intrigue. Ensuite, nous avons une fonction LOAD_DATASET, cette fois, nous avons un ensemble de données IRIS pour générer le tracé. Nous avons passé les colonnes Sepal_length et SEPAL_WIDTH au paramètre x et y pour le tracé ponctuel.

Gimport Seaborn
Importer Matplotlib.pypllot comme plt
marin.set (style = 'whitegrid')
données = Seaborn.load_dataset ("iris")
marin.PointPlot (x = "sepal_length", y = "sepal_width", data = data)
PLT.montrer()

Le tracé ponctuel de l'iris de l'ensemble de données est montré comme suit:

Exemple 4

Le Pandas DataFrame à deux dimensions est approprié pour la structure statistique avec des axes étiquetés qui peuvent être variés et sont mutables en taille (lignes et colonnes). Pour créer le cadre de données du panda, les longueurs de tous les tableaux doivent être égales. Si un index est défini, il devrait avoir la même longueur que les tableaux. Si aucun index n'est défini dans la plage (n), alors par défaut, le N est utilisé, qui est la longueur du tableau.

Dans l'extrait de code donné, nous avons importé le module du panda, puis nous avons appelé le constructeur Pandas DataFrame, où les deux tableaux sont spécifiés sous forme de liste1 et list2. Nous avons une collection de nombres aléatoires dans un tableau de longueur égale. Pour faire le graphique des données ci-dessus, nous avons un tracé KDE. Il montre la densité de probabilité d'une variable continue à différents niveaux. Nous pouvons également créer un graphique séparé pour plusieurs échantillons, facilitant la visualisation des données. La propriété de données est appelée avec les champs qu'il a dans le dataframe.

Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
importer des pandas
données = pandas.DataFrame ("list1": [23, 30, 14, 15, 20],
"List2": [19, 20, 16, 26, 11])
sns.KDEPLOT (données ['list1'], données ['list2'])
PLT.montrer()

Le tracé KDE montre la comparaison du Pandas DataFrame à l'intérieur de la figure.

Conclusion

Maintenant, vous avez un bref article sur le cadre de données de l'intrigue Seaborn ici. Nous pouvons créer le cadre de données par nous-mêmes avec le cadre de données du panda. Les dataframes dans les pandas sont des ensembles de données de lecteur solides que vous devez utiliser pour obtenir une compréhension plus approfondie de vos informations. Nous pouvons également utiliser les cadres de données des échantillons de mer intégrés en utilisant la fonction LOAD_DATASET. Ce cadre de données peut être tracé avec chaque tracé de Seaborn, car nous avons montré les nombreux exemples qui tracent les cadres de données.

Python

Pandas read_csv multiprocessement

Pour améliorer la vitesse de chargement des données, y compris ses avantages et ses limites le «PD.L...

Nathan Blanc

Docker

Qu'est-ce que les montures Docker Bind?

Un support Docker Bind est un type de support qui permet aux utilisateurs de cartographier un répert...

Zoe Martinez

Sqlite

Comment utiliser l'application Web SQLite Viewer

L'application Web SQLite Viewer offre d'excellentes fonctionnalités pour consulter les bases de donn...

Jules Colin