Corrélation de mer

Corrélation de mer
«Pour les analystes de données, la corrélation est une cause d'influence cruciale. Il explique comment les éléments d'une données sont interdépendants les uns aux autres et si ceux-ci se changent les uns des autres. La valeur corrélée peut varier de -1 à +1. Le terme «corrélation» indique que les quantités indépendantes ne sont pas liées les unes aux autres. Une corrélation positive signifie que les éléments fonctionnent efficacement, tandis qu'une association négative signifie qu'elles se déplacent dans différentes directions. Avec l'aide du paquet Seaborn, nous pouvons visualiser la matrice de corrélation. Il est simple pour analyser les données source et est largement utilisé dans le travail analytique. Dans cet article, nous allons vous montrer comment utiliser la méthode HeatMap () pour créer la matrice de covariance."

Exemple n ° 1

La carte thermique est une représentation picturale des données matricielles, avec des teintes de couleurs spécifiques ayant des valeurs distinctes. Il représente la matrice totale d'une manière très concise. Dans l'exemple suivant, nous aurons utilisé une carte thermique pour représenter une analyse de corrélation.

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
df = pd.DataFrame (“2nd Mois ": [8,2,4,6,9,0,6,7],
"3rd Mois ": [3,1,7,3,2,8,4,1],
"4e Mois ": [5,7,6,9,7,0,3,4],
"5e Mois ": [4,7,8,4,2,9,7,6])
sns.masse thermique (df.corr ())
PLT.montrer()

Ici, nous allons intégrer les fichiers d'en-tête pandas, matplotlib.pypllot et mer. Le fichier d'en-tête Pandas sera intégré en tant que PD, Matplotlib.pypllot comme plt et marin comme sns. Pour définir l'ensemble de données, nous avons créé quatre tableaux différents. Ces tableaux contiennent différentes valeurs numériques aléatoires.

Nous avons appliqué la méthode DataFrame (). Cette fonction est liée à la bibliothèque de Pandas. Pour dessiner la coffre de corrélation de Seaborn, nous allons appeler la fonction HeatMap (). Nous avons donné le Corr () comme paramètre à la fonction thermap () du module SeaBorn. Nous avons invoqué la fonction show () pour illustrer l'intrigue.

Exemple n ° 2

Nous allons dessiner une visualisation de la carte thermique de corrélation maritime. La méthode Corr () est utilisée pour obtenir la matrice de covariance de DataFrame. Cette méthode pourrait être utilisée pour analyser plusieurs types de coefficients de corrélation. La teinte pour chaque élément du cadre des axes de tonalité sera spécifiée. De nombreuses variables seraient utilisées pour modifier le graphique.

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
df = pd.DataFrame (“2nd Mois ": [8,2,4,6,9,0,6,7],
"3rd Mois ": [3,1,7,3,2,8,4,1],
"4e Mois ": [5,7,6,9,7,0,3,4],
"5e Mois ": [4,7,8,4,2,9,7,6])
sns.masse thermique (df.corr (), vmin = -1, vmax = +1, annot = true, cmap = 'coolwarm')
PLT.montrer()

Tout d'abord, nous incorporerons les bibliothèques requises Pandas en tant que PD, Matplotlib.pypllot comme plt et marin comme sns. Nous avons défini quatre tableaux pour représenter la collecte de données. Divers numéros aléatoires sont inclus dans ces tableaux. La fonction DataFrame () a été utilisée. Cette méthode est associée au package du panda.

Nous appliquerons la méthode HeatMap () pour créer la corrélation de mer. Nous avons passé Corr () comme argument à la méthode HEATMAP () de la bibliothèque de Seaborn. La valeur du paramètre «Annot» sera définie sur «vrai». Pour visualiser l'intrigue, nous avons invoqué la méthode show ().

La valeur de l'axe visuel est définie en utilisant les paramètres VMIN et VMAX. Le paramètre CMAP modifie ici la combinaison de couleurs du graphique. Les données de corrélation sont présentées sur les blocs à l'aide de l'option Annot.

Exemple n ° 3

Lorsqu'une partie du contenu sur un bord du plan horizontal principal est éliminée, aucune donnée pertinente n'est supprimée car elle est dupliquée. Nous ferons cependant une carte triangulaire à cause de cela, comme nous le voyons ci-dessous.

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
Importer Numpy comme NP
df = pd.DataFrame (“2nd Mois ": [8,2,4,6,9,0,6,7],
"3rd Mois ": [3,1,7,3,2,8,4,1],
"4e Mois ": [5,7,6,9,7,0,3,4],
"5e Mois ": [4,7,8,4,2,9,7,6])
upp_mat = np.triu (df.corr ())
sns.masse thermique (df.corr (), vmin = -1, vmax = +1, annot = true, cmap = 'coolwarm', mask = upp_mat)
PLT.montrer()

Au début du programme, nous importerons les bibliothèques requises Pandas en tant que PD, Matplotlib.pypllot comme plt et marin comme sns. Nous définirons quatre tableaux distincts pour incarner l'ensemble de données. De nombreux chiffres aléatoires ont été impliqués dans ces tableaux. Ensuite, nous avons appliqué la fonction DataFrame (). Le module de Pandas est lié à cette fonction. Nous allons appeler la fonction thermap () pour insérer la corrélation de la mer.

Nous avons spécifié le Corr () comme argument à la méthode HeatMap () du paquet SeaBorn. Nous avons fourni les valeurs les plus élevées et les plus basses des bords, ainsi que la teinte de l'intrigue et du masque comme argument. La valeur du paramètre «annot» sera définie comme «vraie» et la valeur du «masque» sera «upp_mat». Pour représenter le graphique résultant, nous avons appelé la méthode show ().

Dans le programme précédent, nous utilisons VMax pour obtenir la pyramide la plus haute de la diagonale et la filtrerons ensuite à l'aide du paramètre de masque de la méthode HeatMap (). De même, le VMIN peut être utilisé pour déguiser la pyramide inférieure.

Exemple n ° 4

Nous ne pouvons intégrer qu'un seul paramètre et évaluer son association avec plusieurs autres éléments, qui est une représentation intrigante. L'association du paramètre du 3ème mois entre d'autres éléments est illustrée dans ce cas.

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
Importer Numpy comme NP
df = pd.DataFrame (“2nd Mois ": [8,2,4,6,9,0,6,7],
"3rd Mois ": [3,1,7,3,2,8,4,1],
"4e Mois ": [5,7,6,9,7,0,3,4],
"5e Mois ": [4,7,8,4,2,9,7,6])
upp_mat = np.triu (df.corr ())
sns.masse thermique (df.corr () [['3rd Mois ']], vmin = -1, vmax = +1, annot = true, cmap =' coolwarm ')
PLT.montrer()

Nous inclurons les frameworks essentiels Pandas en tant que PD, Matplotlib.pypllot comme plt, et Seaborn que SNS au début du code. Pour encapsuler les données collectées, nous ferons quatre listes différentes. Ces listes ont inclus de nombreuses valeurs aléatoires. Après cela, nous utiliserons la méthode DataFrame (). Cette méthode est inextricablement liée au package des Pandas.

Pour incorporer la Corrélation Seaborn Thermap, nous appellerons la méthode HeatMap (). La fonction Corr () a été transmise comme paramètre à la fonction HEATMAP () du module SeaBorn. Nous avons également spécifié les valeurs les plus grandes et les plus bases des bords et la couleur et le masque de l'intrigue comme entrée. L'argument «Annot» sera défini sur «vrai» et l'argument «CMAP» sera défini sur «Coolwarm.«Le« 3e mois »sera transmis à la fonction corr () comme un paramètre. Nous avons utilisé la fonction show () pour voir le graphique produit.

Conclusion

Dans cet article, nous avons parlé des nombreuses méthodologies qui sont utilisées pour dessiner la corrélation de mer. Nous pouvons modifier la couleur de la carte thermique en fournissant le paramètre CMAP à la fonction. Une carte thermique de corrélation est une visualisation qui représente une matrice de covariance bidimensionnelle entre 2 paramètres différents, contenant des cellules colorées affichant des valeurs sur un spectre minimaliste.