L'estimation de la densité du noyau (KDE) est une technique pour représenter la distribution conditionnelle des paramètres d'entrée linéaires et non linéaires. La méthode KDEPLOT () renvoie un graphique sémantique beaucoup moins complexe chaque fois que nous voulons afficher de nombreuses dispersions. Divers ensembles de données ont pu être vus en utilisant une présentation graphique dans KDE. C'est une forme beaucoup plus efficace d'analyse visuelle. L'estimation de la densité du noyau (KDE) est un modèle prédictif pour calculer et visualiser la probabilité postérieure d'une variable discrète. L'analyse ne fait aucune hypothèse concernant l'ensemble de données, y compris si elle reflète les exigences d'une norme ou de toute probabilité.
L'estimation de la densité du noyau est une version histogramme simplifiée qui n'inclut pas la ligne de périodes de distribution et les points terminaux respectifs. La création de chiffres distincts pour les ensembles de données et la combinaison de ceux-ci pour créer une forme complète fournit une ligne rectifiée pour la distribution postérieure d'un ensemble de données original.
SeaBorn est un cadre de programmation comme Matplotlib. Seaborn pourrait être utilisé pour la visualisation avec les pandas et les modules Numpy. Les analystes de données utilisent des boîtes à outils pour faire des représentations graphiques analytiques pertinentes et attrayantes. Avec l'aide de la méthode Kdeplot () de la bibliothèque Seaborn, nous pouvons dessiner des graphiques statistiques descriptifs et inférentiels.
Nous allons examiner comment utiliser Seaborn pour visualiser les graphiques KDE. Pour illustrer la disposition du graphique KDE, cet article utilisera quelques instances des données originales.
Exemple 1
Nous pouvons valider le modèle à l'aide du package Seaborn en appelant la méthode standard kdeplot (). Nous avons rassemblé 2500 données de séquence avec le module randomisé dans le scénario suivant. Ensuite, les placés dans un cadre de données Numpy car le paquet Seaborn interagit exclusivement avec le module Numpy et le module Pandas. L'exemple de code de Seaborn pour cette instance est apposé ci-dessous:
Nous allons commencer le programme en incorporant les fichiers d'en-tête nécessaires. Le fichier d'en-tête Seaborn sera intégré sous le nom de SN, Matplotlib.Pyplot sera intégré en tant que PLT, et Numpy sera intégré en tant que NP. À l'étape suivante, nous avons indiqué l'ensemble de données de 2500 entrées. Cela peut être accompli en utilisant la méthode randn () de la bibliothèque Numpy.
Nous avons utilisé la fonction KDEPLOT () pour dessiner un graphique KDE. Cette fonction est liée au paquet Seaborn. Nous avons fourni le cadre de données, la couleur et l'ombre comme arguments de la fonction kdeplot (). Ici, nous définissons la valeur de l'ombre comme «vrai» et la valeur de la couleur comme «violet». Ce code sera résilié en appelant la fonction show () du matplotlib.module pyplot. Cette fonction représente le tracé final.
Exemple n ° 2
En utilisant la fonction KDeplot () et le cadre de SeaBorn, nous pourrions représenter davantage l'ensemble des données en diagonale ou inverser le graphique résultant. Pour inverser l'affichage, nous avons utilisé le paramètre graphique vertical = true. L'exemple de code de Seaborn pour cette instance est apposé ci-dessous:
Tout d'abord, nous avons importé les bibliothèques: Seaborn, Matplotlib.pypllot et numpy. Nous devons définir les 1000 collections de données. La fonction Randn () de la bibliothèque Numpy peut être utilisée pour accomplir cela. Pour créer une carte KDE, nous avons utilisé la méthode KDEPLOT (). Le module Seaborn est connecté à cette fonction. La méthode KDEPLOT () a divers arguments: un cadre de données, une couleur et une teinte. Nous voulons que l'intrigue soit dessinée verticalement dans ce cas. En conséquence, nous avons utilisé l'argument «vertical» et défini sa valeur sur «vrai».
Nous avons ajusté la valeur de l'ombre en «vrai» et la valeur de couleur en «vert». Ce code serait terminé en exécutant le matplotlib.Fonction Show () du module Pyplot. Le graphique final a été représenté à l'aide de cette méthode.
Exemple n ° 3
Nous prenons les deux paramètres dans la fonction KDEPLOT () du package Seaborn pour construire le tracé KDE de régression multivariée pour les paramètres dépendants. La fonction KDEPLOT () est utilisée pour tracer des données. Dans le code suivant, nous montrerons comment obtenir un tracé KDE de régression multivariée. L'exemple de code de Seaborn pour cette instance est apposé ci-dessous:
Les fichiers d'en-tête doivent être inclus au début du script. Le PD serait importé par la bibliothèque Pandas, SNS serait importé par la bibliothèque Seaborn et PLT serait importé à l'aide de Matplotlib.pypllot. En plus de tout cela, nous incluons un module en ligne Matplotlib.
À l'étape suivante, nous définirons les ensembles de données pour l'axe X et l'axe Y. Nous définissons les ensembles en appelant la méthode randn () de la bibliothèque Numpy. Maintenant, nous avons invoqué la fonction KDEPLOT () pour dessiner le graphique KDE. Nous avons donné les ensembles de données des deux axes comme paramètres de cette méthode. La fonction show () est utilisée pour illustrer le graphique résultant:
Exemple n ° 4
Notre code utilisera le «CBAR» dans cet argument de contexte. Si la valeur de «cbar» est vraie, une barre de couleur est appliquée à un graphique de régression multivarié pour mettre en évidence la représentation de la teinte. Malheureusement, il n'autorise pas les visualisations avec un paramètre de couleur. L'exemple de code de Seaborn pour cette instance est apposé ci-dessous:
Après avoir introduit les bibliothèques requises, Pandas, Seaborn, Numpy et Matplotlib.Pypllot, les cadres de données de l'axe X et de l'axe y ont été spécifiés. Les ensembles sont définis lors de l'utilisation de la fonction Randn () de la bibliothèque Numpy. Nous avons appelé l'outil Kdeplot () pour dessiner le graphique KDE. Cette méthode est une composante du paquet Seaborn. Les paramètres de cette méthodologie sont les ensembles de données des deux axes. Nous avons passé l'argument «CBAR» à la méthode Kdeplot (). La méthode show () sera utilisée pour visualiser le graphique obtenu.
Conclusion
Dans cet article, nous avons utilisé la présentation du graphique KDE avec le module Pandas et le paquet Seaborn. Dans un graphique 1D KDE, nous avons observé comment représenter le modèle probabiliste d'une et de nombreuses variables. Nous avons parlé de la façon de représenter un ensemble de données 2D en utilisant la disposition KDE avec le cadre SeaBorn. Nous avons également fourni la méthode KDeplot () avec certains paramètres pour observer comment ils ont affecté la carte.