Cela ressemble beaucoup à couvrir. Commençons maintenant.
Qu'est-ce que la bibliothèque Python Seaborn?
La bibliothèque Seaborn est un package Python qui nous permet de faire des infographies basées sur des données statistiques. Comme il est fabriqué sur Matplotlib, il est donc intrinsèquement compatible avec lui. De plus, il prend en charge la structure de données Numpy et Pandas afin que le traçage puisse être effectué directement à partir de ces collections.
La visualisation des données complexes est l'une des plus importantes. Si nous devions comparer Matplotlib à Seaborn, SeaBorn est capable de rendre ces choses faciles qui sont difficiles à réaliser avec Matplotlib. Cependant, il est important de noter que Seaborn n'est pas une alternative à Matplotlib mais un complément de celui-ci. Tout au long de cette leçon, nous utiliserons également les fonctions matplotlib dans les extraits de code. Vous sélectionnez pour travailler avec SeaBorn dans les cas d'utilisation suivants:
Une note avant de commencer est que nous utilisons un environnement virtuel pour cette leçon que nous avons faite avec la commande suivante:
python -m virtualv sebornUne fois que l'environnement virtuel est actif, nous pouvons installer la bibliothèque SeaBorn dans l'env virtual afin que les exemples que nous créons ensuite puissent être exécutés:
pip installer SeabornVous pouvez également utiliser Anaconda pour exécuter ces exemples, ce qui est plus facile. Si vous souhaitez l'installer sur votre machine, regardez la leçon qui décrit «comment installer Anaconda Python sur Ubuntu 18.04 LTS »et partagez vos commentaires. Maintenant, passons à divers types de parcelles qui peuvent être construites avec Python Seaborn.
Utilisation de l'ensemble de données Pokémon
Pour garder cette leçon pratique, nous utiliserons un ensemble de données Pokemon qui peut être téléchargé à partir de Kaggle. Pour importer cet ensemble de données dans notre programme, nous utiliserons la bibliothèque Pandas. Voici toutes les importations que nous effectuons dans notre programme:
Importer des pandas en tant que PDMaintenant, nous pouvons importer l'ensemble de données dans notre programme et afficher certaines des exemples de données avec des pandas comme:
df = pd.read_csv ('Pokémon.csv ', index_col = 0)Notez que pour exécuter l'extrait de code ci-dessus, l'ensemble de données CSV doit être présent dans le même répertoire que le programme lui-même. Une fois que nous exécuterons l'extrait de code ci-dessus, nous verrons la sortie suivante (dans le cahier d'Anaconda Jupyter):
Tracer la courbe de régression linéaire
L'une des meilleures choses à propos de SeaBorn est les fonctions de traçage intelligentes qu'il fournit qui ne visualisent pas seulement l'ensemble de données que nous lui fournissons, mais aussi construisez des modèles de régression autour. Par exemple, il est possible de construire un tracé de régression linéaire avec une seule ligne de code. Voici comment faire ceci:
sns.lmplot (x = 'attaque', y = 'défense', data = df)Une fois que nous exécuterons l'extrait de code ci-dessus, nous verrons la sortie suivante:
Nous avons remarqué peu de choses importantes dans l'extrait de code ci-dessus:
N'ayez pas peur si vous pensiez que nous ne pouvons pas avoir un complot sans cette ligne de régression. Nous pouvons ! Essayons maintenant un nouvel extrait de code, similaire au dernier:
sns.lmplot (x = 'attaque', y = 'défense', data = df, fit_reg = false)Cette fois, nous ne verrons pas la ligne de régression dans notre intrigue:
Maintenant, c'est beaucoup plus clair (si nous n'avons pas besoin de la ligne de régression linéaire). Mais ce n'est pas encore terminé. SeaBorn nous permet de faire différents cette intrigue et c'est ce que nous ferons.
Construire des parcelles de boîte
L'une des plus grandes caractéristiques de SeaBorn est la façon dont il accepte facilement la structure des données de données Pandas pour tracer les données. Nous pouvons simplement transmettre un dataframe à la bibliothèque Seaborn afin qu'il puisse en construire un boîtier de boxe:
sns.boxplot (data = df)Une fois que nous exécuterons l'extrait de code ci-dessus, nous verrons la sortie suivante:
Nous pouvons supprimer la première lecture du total car cela semble un peu gênant lorsque nous tracez réellement les colonnes individuelles ici:
Une fois que nous exécuterons l'extrait de code ci-dessus, nous verrons la sortie suivante:
Tableau de grains avec Seaborn
Nous pouvons construire une intrigue Swarm de conception intuitive avec SeaBorn. Nous utiliserons à nouveau le DataFrame de Pandas que nous avons chargé plus tôt, mais cette fois, nous appellerons la fonction Show de Matplotlib pour afficher l'intrigue que nous avons faite. Voici l'extrait de code:
sns.set_context ("papier")Une fois que nous exécuterons l'extrait de code ci-dessus, nous verrons la sortie suivante:
En utilisant un contexte Seaborn, nous permettons à Seaborn d'ajouter une touche personnelle et une conception fluide pour l'intrigue. Il est possible de personnaliser encore plus ce tracé avec une taille de police personnalisée utilisée pour les étiquettes dans l'intrigue pour faciliter la lecture. Pour ce faire, nous passerons plus de paramètres à la fonction set_context qui fonctionne comme ce qu'ils semblent. Par exemple, pour modifier la taille de la police des étiquettes, nous utiliserons la police.paramètre de taille. Voici l'extrait de code pour effectuer la modification:
Une fois que nous exécuterons l'extrait de code ci-dessus, nous verrons la sortie suivante:
La taille de la police de l'étiquette a été modifiée en fonction des paramètres que nous avons fournis et de la valeur associée à la police.paramètre de taille. Une chose que SeaBorn est experte est de rendre l'intrigue très intuitive pour une utilisation pratique et cela signifie que SeaBorn n'est pas seulement un package de python de pratique, mais en fait quelque chose que nous pouvons utiliser dans nos déploiements de production.
Ajout d'un titre aux parcelles
Il est facile d'ajouter des titres à nos parcelles. Nous avons juste besoin de suivre une procédure simple d'utilisation des fonctions au niveau des axes où nous appellerons le set_title () Fonction comme nous montrons dans l'extrait de code ici:
sns.set_context ("papier", font_scale = 3, rc = "Font.taille ": 8," Axes.libelsize ": 5)Une fois que nous exécuterons l'extrait de code ci-dessus, nous verrons la sortie suivante:
De cette façon, nous pouvons ajouter beaucoup plus d'informations à nos parcelles.
Seaborn vs Matplotlib
En regardant les exemples de cette leçon, nous pouvons identifier que Matplotlib et Seaborn ne peuvent pas être directement comparés, mais ils peuvent être considérés comme se complétant les uns les autres. L'une des caractéristiques qui mène SeaBorn 1 à l'avance est la façon dont SeaBorn peut visualiser les données statistiquement.
Pour faire le meilleur des paramètres de SeaBorn, nous vous recommandons fortement de regarder la documentation de SeaBorn et de découvrir quels paramètres utiliser pour rendre votre intrigue aussi proche des besoins de l'entreprise possible.
Dans cette leçon, nous avons examiné divers aspects de cette bibliothèque de visualisation de données que nous pouvons utiliser avec Python pour générer des graphiques beaux et intuitifs qui peuvent visualiser les données sous une forme que l'entreprise souhaite à partir d'une plate-forme. Le SeaBorm est l'une des bibliothèques de visualisation les plus importantes en ce qui concerne l'ingénierie des données et la présentation de données sous la plupart.
Veuillez partager vos commentaires sur la leçon sur Twitter avec @sbmaggarwal et @linuxhint.