Plot de dispersion de Seaborn

Plot de dispersion de Seaborn

«Seaborn est une magnifique technique de visualisation Python pour afficher des représentations analytiques. Il comprend des styles standard attrayants et des couleurs vibrantes qui créent des graphiques statistiques qui sont très captivants. Il est implémenté au début du cadre Matplotlib et est intimement lié aux modules de Panda. Les diagrammes de dispersion sont utilisés avec une variété de catégories sémantiques pour aider à l'analyse visuelle. Cela peut créer des visuels bidimensionnels qui pourraient être étendus en traduisant en différents paramètres et en utilisant la couleur, la taille et.

Toutes les caractéristiques influencent l'interprétation optique qui peut être utilisée pour différencier les sous-ensembles. Lorsqu'il s'agit de produire des visuels plus efficacement, l'utilisation d'interprétations redondantes sera utile. Dans cet article, nous avons passé plusieurs approches utilisées pour dessiner les diagrammes de dispersion en utilisant la bibliothèque Seaborn."

Utiliser la fonction de dispersion ()

Nous avons utilisé la méthode de dispersion () pour créer le bloc de dispersion. Ici, l'ensemble de données de conseils est utilisé dans le diagramme de dispersion. Ce serait une collection de données de pourboire en fonction de la facture globale. Pour un tracé, nous pouvons utiliser n'importe quel cadre de données. Le code est écrit dans Windows CMD et affiché comme suit.

Tout d'abord, peu de bibliothèques requises ont été importées. La bibliothèque Numpy sera importée en NP; Les pandas seront importés en PD, Matplotlib sera importé sous le nom de MPL, malplotlib.Pypllot en tant que PLT et Seaborn seront importés sous le nom de SNS. Dans la ligne suivante, la fonction de chargement de données () est appliquée pour charger la trame de données. Nous avons fourni des «conseils» comme argument pour cette fonction.

Ensuite, nous appliquons la fonction SET () de la bibliothèque Seaborn pour spécifier les codes de couleur. Pour dessiner le diagramme de dispersion, nous avons utilisé la méthode Satterplot (). Cette fonction contient trois paramètres différents tels que les valeurs des axes X, Y et la valeur des données. Nous avons utilisé la méthode Show () pour représenter le tracé.

Tracer différentes catégories

Nous utiliserons un paramètre appelé «teinte» dans ce diagramme de dispersion; il permet aux utilisateurs d'afficher les composants d'une variable graphique. Cet attribut sera utilisé pour visualiser les catégories dans une variable nominale. Le lien entre la longueur et la largeur du sépale de plusieurs variétés a été affiché. L'attribut Hue nous permet de représenter des valeurs catégorisées dans différentes tons. Le code est écrit dans Windows CMD et affiché comme suit.

Après avoir inclus les bibliothèques Seaborn et Matplotlib.pypllot, nous avons déclaré la variable «iris_data.»Et nous avons attribué les données chargées de l'iris à cette variable. Dans la ligne suivante, nous avons spécifié la taille du graphique en utilisant la fonction Figure (). La taille est stockée dans la variable «F."

Maintenant, nous avons appliqué la méthode de dispersion (). Cette fonction est utilisée pour dessiner le tracé. Nous avons donné les étiquettes des deux axes, la valeur de la teinte et le cadre de données comme paramètres. En fin de compte, la fonction show () est utilisée pour illustrer l'intrigue.

Personnalisez la couleur

En utilisant l'argument de la palette, nous avons affiché le diagramme de dispersion avec un jeu de couleurs personnalisé. Cette fonctionnalité permet l'affichage de la variable catégorisée via une teinte en expansion, avec les catégories indiquées dans l'ordre d'augmenter le paramètre d'agrégat numérique du plus pâle aux nuances plus sombres.

Étant donné que l'espèce a une longueur florale plus longue que les autres espèces, elle est représentée dans l'ombre la plus sombre, tandis que ceux avec des espèces de taille de pétale plus courts sont représentés dans des teintes plus claires. Le code est écrit dans Windows CMD et affiché comme suit.

Au début du programme, nous venons d'intégrer les fichiers d'en-tête requis pour le traçage. La fonction de chargement de données () serait utilisée pour charger le cadre de données de l'iris. Cette méthode reflète les principaux attributs de trois fleurs d'iris différentes, y compris la longueur, la largeur du sépale, la longueur et la largeur du pétale. La taille de la figure définie est définie par la figure de fonction ().

Ensuite, en utilisant la méthode Satterplot (), nous avons tracé la longueur des pétales des différentes fleurs d'iris du cadre de données dans un tracé de dispersion. La longueur des pétales des trois variétés de fleurs diffère considérablement. Nous spécifions la valeur de l'argument «palette» en «magma» dans la fonction. Nous avons utilisé la méthode show () pour désigner le tracé résultant.

Ajuster la forme

Nous utiliserons également le paramètre «marqueur» pour personnaliser le motif de point de dispersion à toutes les conceptions sélectionnées. Dans le paramètre du marché, nous pouvons spécifier le style des points de dispersion qui nécessitent. Dans ce cas, nous avons indiqué les points avec un symbole «+». Le paramètre supplémentaire nommé «Alpha» est utilisé pour afficher la luminance relative des différents points. Le code est écrit dans Windows CMD et affiché comme suit.

Le Seaborn et le matplotlib.Des fichiers d'en-tête PYPLOT ont été introduits. Nous devons charger le cadre de données de l'iris, nous avons donc utilisé LOAD_DATASET (). La ligne suivante contient la fonction dans laquelle nous ajustez la taille du tracé. Pour créer l'intrigue, nous avons utilisé la fonction de dispersion (). Pour les différents types de fleurs d'iris, nous avons affiché la largeur du sépale sur l'axe x de l'intrigue et la longueur du pétale sur l'axe y.

Pour identifier les points de dispersion en fonction de la longueur de diverses espèces, nous avons utilisé un paramètre spécifique. Nous observerons que les points de diffusion changent de taille de plus large à moins selon la longueur du sépale. Nous pouvons définir exactement la différence entre les paramètres utilisant une version spécifique en fournissant le paramètre «tailles». Nous avons fourni la fonction le paramètre «marqueur» et lui avons attribué la valeur «+."Pour représenter l'intrigue, la fonction show () est utilisée.

Conclusion

Nous avons discuté du diagramme de dispersion Seaborn en utilisant différentes instances dans cet article. Nous avons dessiné plusieurs diagrammes de dispersion avec le soutien des bibliothèques Seaborn et Matplotlib. Cet article a également démontré de nombreux éléments de la fonction de dispersion (). La bibliothèque intégrée Seaborn est utilisée dans la langue python. Il offre une interface analytique visuelle unique. Les composants fournissant des ensembles de données, des processus et un traitement des données constituent le système. Les modules Seaborn et Matplotlib sont fréquemment appliqués dans le domaine de l'analyse des données. En ce qui concerne la conception de visuels plus réalisables, l'incorporation de notions multiples peut être préférable.