«Pandas» est un outil haute performance pour l'environnement Python. Il s'agit d'un code source «ouvert» pour l'analyse des données. La jointure Pandas et la méthode de fusion Pandas sont utilisées pour la jonction des deux données de données dans un seul DataFrame. Dans les deux méthodes de pandas, la différence est que la fonction «join» des pandas rejoint le dataframe en utilisant un index. Alors que la fonction «fusionner» Pandas rejoint le dataframe en utilisant l'index et la méthode de la colonne dans laquelle nous pouvons sélectionner la colonne souhaitée nous-mêmes. La méthode de fusion des pandas est utilisée principalement par rapport à la méthode de jointure des pandas. Le logiciel que nous utiliserons pour la mise en œuvre est le logiciel «Spyder», qui est dans l'environnement Python qui vous fournira des avantages pour la mise en œuvre du code de la méthode de jointure Pandas () et de la fonction Méthode Pandas Merge ().
Syntaxe de la méthode pandas join ()
«DF1.rejoindre (df2) »Le «DF» dans la syntaxe ci-dessus est l'abréviation du «DataFrame». Il y a deux dataframes dans la syntaxe avec la fonction «Dot Join», qui est d'appeler la méthode. Il s'agit de la méthode Pandas pour rejoindre deux dataframes. Il fonctionne en utilisant l'index pour combiner les dataframes en un seul.
Syntaxe de la méthode Pandas Merge ()
«DF1.fusionner (df2, on = 'column_name') "La syntaxe de la méthode de fusion Pandas a deux dataframes en tant que «DF1» et «DF2». La fonction «Dot Merge» appelle la méthode pour rejoindre les deux données de données avec l'apparition de colonnes inversées.
Nous couvrirons les façons suivantes de combiner deux dataframes afin d'utiliser les méthodes de fusion Panda et de pandas:
Création des dataframes pour l'implémentation de la méthode de jointure de fusion Pandas et de pandas
Tout d'abord, nous devons créer un cadre de données. Pour cela, nous utiliserons l'outil «Spyder». Après l'avoir ouvert, commencez à écrire le code. Importer des pandas comme «PD» pour la Pandas Library Association. Nous avons les variables DataFrame comme «X», «Y», «P» et «Q en conséquence et« A »avec les valeurs« 1 »et« B »avec la valeur attribuée comme« 2 ».
La sortie est un «DF» créé avec les valeurs attribuées. Nous pouvons le rendre aussi grand que les données.
Création d'un autre dataframe
Nous devons faire une autre dataframe, pour comprendre les méthodes de jointure de pandas et de fusion des pandas clairement. Ici, nous avons «DF» créé de la même manière que le «DF» ci-dessus, seules les valeurs sont des variables attribuées sont différentes. Nous avons «H», «J», «S» et «D», tandis que les valeurs «B» avec la valeur «8» et «Y» avec la valeur «3».
La sortie montre un simple «DF» créé.
Exemple # 01: Méthode de jointure Pandas (chevauchement)
Maintenant, nous verrons comment rejoindre deux dataframes avec la méthode de jointure Pandas. Pour cette méthode, nous pouvons choisir la colonne de votre choix sur lequel nous voulons travailler dans le dataframe. Nous avons pris l'exemple avec la colonne de chevauchement «à gauche» du «DF», afin que nous puissions résoudre ce problème avec le «suffixe» pour surmonter le chevauchement des données. Ici, les variables utilisées sont «X», «Z», «V», «D». «P», «O», «L» et «Y» avec les valeurs attribuées comme «3», «6», «7» et «9». Le ".JOIND ”appelle la méthode, avec le jeu d'alignement à gauche à gauche avec le suffixe" DF "droit. ". Le «suffixe» utilisé dans le code est parce que dans le dataframe, il y a deux colonnes qui ont le même nom qui est «clé» et qui ne chevauchera pas les données.
La sortie n'affiche aucune donnée superposée avec la méthode de joindre deux «DF» à l'aide de la méthode de jointure Pandas.
Exemple # 02: Méthode de jointure Pandas à l'aide d'une réinitialisation d'index
Dans cet exemple, nous spécifierons séparément la colonne avec le paramètre «ON» à utiliser comme «clé» dans la jointure de méthode qui aide à rejoindre les deux dataframes. La chose combinée est faite avec ce paramètre. De plus, l'indice de l'un des deux «DF» devrait être similaire à les rejoindre. Des types similaires de données ou de données utilisés dans le même but peuvent être ensemble pour le traitement. Cela utilisera encore l'index, en utilisant à partir de la droite. Les variables sont les «S», «T», «U», «V», «N», «W», «K» et «Q». Les valeurs attribuées sont «3», «6», «7» et «9». L '«réinitialisation index des points» est une méthode de pandas pour réinitialiser l'index du «DF». L'indice de réinitialisation définit tous les entiers de votre liste de données de données de 0 jusqu'à ce que les données de dataframe se soient allongées.
Voici la sortie affichant avec la méthode de jointure de «clé» index des pandas.
Exemple # 03: Méthode de fusion Pandas (colonne «gauche et droite»)
La méthode de fusion effectue une opération similaire à la méthode de jointure Pandas. Les deux méthodes sont pour combiner des données sur une dataframe similaire. La méthode de fusion est plus polyvalente nécessitant de spécifier la clé. Nous pouvons également le spécifier sur les colonnes gauche et droite en fonction du travail de votre dataframe. Les variables du code sont «S», «D», «G», «F», «K», «J», «B» et «Q». Les valeurs attribuées sont «9», «5», «6» et «7». L'implémentation «join» externe se fait sur «df» en utilisant le paramètre «comment» de la fonction de méthode de fusion pandas.
La sortie que nous voyons montre les données fusionnées des deux dataframes. Le «nan» représente «pas un nombre», ce qui signifie que lorsqu'il n'y a pas de numéro attribué dans les données, le «nan» montre là.
Exemple # 04: la méthode de fusion explicitement
Ici, dans cet exemple, la méthode de fusion est la destruction de l'index et la valeur de l'index n'est pas supposée sur le dataframe. Nous ferons cette méthode en fonction du travail à faire, où la spécification explicite est de suivre. Il fusionnera les données en fonction d'un index gauche ou d'un index droit avec le paramètre. Les variables de cette dataframe sont «t», «r», «i», «u», «h», «o», «e» et «e». Les valeurs attribuées sont «2», «4», «6» et «4». L'exemple ci-dessus de la méthode de fusion Pandas avec la sélection des colonnes selon le besoin est la méthode la plus présentable et la plus précieuse pour rejoindre les deux données de données. Vérification à la fin de la ligne de code sur la clé de fusion est unique dans l'ensemble de données.
Dans la sortie ci-dessous, l'index n'est pas affiché sans l'index mais la fonction est effectuée en fonction de l'index droit et gauche.
Conclusion
Les méthodes Merge () et Join () sont les deux méthodes qui sont très pratiques et efficaces. Ces deux fonctions sont utilisées pour rejoindre les deux données de données distinctes sur la même dataframe mais ont une utilisation différente en fonction de l'affaire. Dans cet article, nous avons appris les principales différences entre la méthode de jointure de pandas et de fusion. Après avoir fait les exemples et compris la méthode de jointure de pandas, nous la conclurons avec la connaissance que, si nous voulons plus flexible et un style de base de données, il est préférable d'aller avec la méthode de fusion Pandas. D'un autre côté, si nous voulons faire le dataframe se combinant avec l'index, nous pouvons accompagner la fonction de méthode pandas join ().