Pandas rejoignent deux dataframes

Pandas rejoignent deux dataframes

«Pandas est l'un des packages du langage Python, ce qui rend l'analyse des données plus facile et flexible pour travailler et traiter mieux. Plusieurs fois, dans la vraie vie, nous sommes confrontés à la situation où nous avons fait notre travail dans plusieurs fichiers différents, et parfois nous devons voir toutes les données ensemble dans une seule «dataframe» pour analyser les données au lieu d'avoir les données à différents endroits. Ainsi, les pandas nous fournissent cette chose possible en nous facilitant. Il existe différentes façons d'effectuer cette méthode; Nous allons mettre en œuvre la méthode «jointure» des pandas de toutes les différentes manières possibles. La méthode join () est principalement utilisée et rejoint les dataframes en fonction de «l'index». Nous utiliserons l'outil «Spyder» pour l'implémentation des codes; Ce sont des logiciels axés sur Python qui nous fourniront des avantages pour l'implémentation du code de la méthode de jointure Pandas ()."

Syntaxe

"Trame de données. rejoindre"

La syntaxe ci-dessus est utilisée pour rejoindre les deux dataframes ensemble. Cela fonctionne toujours en utilisant l'autre index à des fins de jonction. Le DataFrame peut être écrit comme «DF». Le «Dot Join» est pour l'appel de la méthode. Comme il utilise l'index, mais il n'y a pas de mal ni de modifications effectuées dans la vraie. L'indice de données réel est conservé comme l'original.

Paramètre

Plus tard, nous utiliserons un paramètre comme «autre» DataFrame. Cela aide à rejoindre les deux DataFrames ensemble; La chose combinée est faite avec ce paramètre. De plus, l'indice de l'un des deux «DF» devrait être similaire à les rejoindre. Cela signifie que des types similaires de données ou de données utilisés dans le même but peuvent être ensemble pour le traitement.

Voici les différentes façons dont nous ferons les exemples de mise en œuvre de la méthode join () dans un «DF».

  • Méthode de jointure panda en utilisant les index.
  • Méthode de jointure panda à l'aide de colonnes (clés).
  • La méthode de jointure Panda conserve l'index d'origine Dataframe.
  • Méthode de jointure Panda en utilisant non-UIQUE (clé).

Création du dataframe pour l'implémentation de la méthode de join ()

Ici, tout d'abord, nous devons importer la bibliothèque Pandas en tant que «PD», alors nous créerons le dataframe composé de deux colonnes, l'une est de la «clé» comme «T0», «T1», «T2», «T3 "," T4 "et" T5 "et l'autre est de" N "les valeurs comme" N0 "," N1 "," N2 "," N3 "," N4 "et" N5 ". Le «DF» représente le dataframe dans le code.

La sortie montre les données entrées dans le DataFrame; Nous pouvons voir les colonnes «clé» et «n» sont imprimées.

Création d'un autre dataframe pour la méthode panda join ()

Nous créons une autre dataframe car nous ferons séparer les dataframes, puis nous les combinerons en utilisant la méthode pandas join (). Le DataFrame se compose de deux colonnes; Alors que nous créons le dernier «DF», la colonne «clé» a des valeurs comme «T0», «T1», «T2» et «T3»; D'un autre côté, l'autre colonne a les valeurs de «M» comme «M0», «M1», «M2», «M3».

Voici la sortie affichant la création simple de dataframe en fonction du code.

Vous pouvez voir qu'il y a deux dataframes, et nous voulons les avoir tous les deux ensemble dans le même dataframe, donc nous ferons les exemples maintenant pour voir comment cela se produira.

Exemple # 01: Méthode panda join () Utilisation des index

Ouvrez l'outil «Spyder». Maintenant, pour rejoindre les deux DataFrames ensemble, nous devons d'abord créer les deux données de données pour les rejoindre. Ici, les dataframes se composent des variables «x» et «y» avec des valeurs attribuées comme «x» avec «x0», «x1», «x2», «x3», «x4» et «x5» tandis que «y» A moins de valeurs, qui sont «Y0», «Y1», «Y2» et «Y3». Les valeurs de «clé» sont de «K0» à «K5» et dans d'autres «DF», les valeurs de «clé» sont de «K0» à «K2». Ensuite, le dataframe avec l'appel de la méthode «dot join» combinera les deux «DF». Le «suffixe» utilisé dans le code est parce que, dans le dataframe, il y a deux colonnes qui ont le même nom, je.e., "clé". Qui ne chevauchera pas les données.

La sortie affiche les deux «DF» en un. Comme nous pouvons le voir qu'il y a certaines valeurs comme «nan», ce qui signifie que ce n'est pas un «nombre». Le «df» a plus de valeurs que le deuxième «DF», donc, où il n'y a pas de valeur attribuée, elle montre comme «Nan».

Exemple # 02: Méthode de jointure Panda à l'aide des colonnes (clés)

Comme nous savons maintenant comment rejoindre deux DataFrames ensemble, nous allons maintenant le faire en utilisant la méthode de colonne «clé». La méthode de colonne de clé organise les données comme des colonnes concernant leur index. Ici, le dataframe se compose des variables «n» et «w». Le «N» a des valeurs comme «N0», «N1», «N2», «N3», «N4» et «N5». Tandis que «w» a les valeurs «w0», ​​«w1» et «w2». Le df avec ".set index "s'affiche avec la" clé "et avec la méthode de jointure d'appel comme".joints ”, avec l'autre index« df »joint. Cette méthode de jointure combinera à la fois «DF» en utilisant leur index. Ceci est une méthode très efficace d'adhésion aux pandas qui aidera diversement dans un environnement de mégadon.

La sortie à l'aide de la méthode de colonne index join () de Pandas montre les colonnes avec des valeurs clés et les variables «n» et «w».

Exemple # 03: Méthode de jointure Panda Préservant l'index d'origine Dataframe

Dans cet exemple, nous verrons et prouverons ce que nous avons écrit ci-dessus que les données sont conservées à son état d'origine. Ici, les dataframes ont les variables «p» et «w». Le «P» avec les valeurs «P0», «P1», «P2», «P3», «P4» et «P5». «W» avec les valeurs «Q0», «Q1» et «Q2». Le ".Rejoindre «l'implémentation dans le« DF »est défini avec« l'index »(clé). Cette méthode montrera les données conservées avec l'index «les données d'origine».

L'affichage représente les données réelles sans que l'originalité soit prise.

Exemple # 04: Méthode de jointure Panda en utilisant non-UIQUE (clé)

Maintenant, nous ferons un exemple pour comprendre une méthode unique. Dans l'exemple précédent, nous avons appris comment les données d'origine sont conservées. Cela a été fait en montrant les deux dataframes disponibles sur le code. Nous allons maintenant faire de même pour vérifier l'état d'origine et nous joindre à la méthode à l'autre «DF» n'étant pas là. Le «DF» a ici «P» et la «clé». «P» a les valeurs de «P0» à «P5» continue et «clé» des valeurs de «K0» à «K5» respectivement. L'appel de la méthode «dot join» se fait avec l'autre «Index de set» induisant la «clé».

La sortie est similaire à la sortie du dernier exemple. Les données sont capturées à partir des données conservées qui étaient originales.

Conclusion

La méthode de pandas rejoignant deux dataframe est efficace et pratique. Cette méthode utilise le «.Rejoignez »Fonction pour faire fonctionner les données et pour joindre les DataFrames ensemble. Cette méthode est un excellent moyen de présenter les données, en particulier lorsque nous travaillons sur une énorme quantité de données dans le répertoire partout où l'analyse des données est effectuée. Nous avons discuté de la façon dont la méthode de jointure Panda peut être mise en œuvre pour une meilleure compréhension de la fonction. Nous avons fait la manière «index», la manière «colonne» et la manière «clé» pour apporter les deux données de données différentes en un seul.