Pandas cross join

Pandas cross join
Python est un langage bien construit pour l'analyse des données, principalement en raison du fort écosystème d'outils Python centrés sur les données. Pandas a des attributs pour effectuer une jointure gauche, droite, intérieure ou extérieure et fusionnez sur deux dataframes ou séries. De plus, il n'y a actuellement aucune technique pour faire une jointure croisée pour fusionner ou combiner deux opérations avec l'argument comment = «croix». Nous le ferons en utilisant la méthode Pandas «Merge ()» dans cet article avec deux exemples.

Méthode Pandas Merge ()

Le «PD.Merge () »peut être utilisé par la syntaxe donnée suivante:

Ici, certains paramètres nécessaires sont «à gauche», ce qui signifie le dataframe gauche, la «droite», ce qui signifie le bon dataframe, le «comment» sur la façon de rejoindre les dataframes, le «ON» qui fait référence à la colonne que nous avons utilisée pour rejoindre le Deux dataframes., et le "Left_on" et "droite" qui aident à spécifier la colonne gauche ou droite pour rejoindre.

Nous effectuerons quelques exemples pratiques pour implémenter cette méthode dans cet apprentissage pour trouver une jointure croisée entre deux dataframes.

Exemple 1: Utilisation de Pandas PD.Méthode Merge () pour obtenir une jointure de croix entre deux dataframes avec une seule colonne

En commençant par la première illustration de l'implémentation pratique du code Python pour effectuer une jointure croisée sur Pandas DataFrames, nous devons rechercher un outil ou un logiciel qui peut exécuter nos codes Python. De nombreux outils prennent en charge la langue Python. Parmi ces différents choix, nous sélectionnons l'outil «Spyder». Nous devons d'abord installer la configuration de l'outil «Spyder». Une fois cela fait, nous lançons l'outil. Ouvrez un nouveau fichier en cliquant sur le bouton «Fichier», en appuyant sur le symbole du fichier ou en appuyant sur les touches «Ctrl + N».

Notre nouveau fichier avec le «.L'extension py ”qui fait référence à« Python »est prête à commencer à travailler. Concentrons-nous maintenant sur le code. Vous pourriez observer que le premier mot du titre de notre article est «Pandas», ce qui signifie que quelque chose va être fait en utilisant la bibliothèque «Pandas». Nous comprenons que notre condition préalable à l'implémentation de ce code est d'importer la bibliothèque Pandas dans le fichier Python. Nous avons écrit une ligne de code «Importer des pandas comme PD». Cela importe toutes les fonctionnalités de la bibliothèque Pandas. De plus, nous avons utilisé le «AS PD», ce qui signifie que partout où nous avons besoin d'accéder à n'importe quelle méthode Pandas dans ce code, nous devons écrire «PD» au lieu d'écrire la forme complète «Pandas».

Au moment où nous effectuons la jointure croisée, nous devons avoir deux pandas dataframes où nous exerçons cette méthode. Vous apprendrez ici comment construire une dataframe définie par l'utilisateur. Pour créer un dataframe, Pandas nous donne un «PD.Fonction DataFrame () »où« PD »est le« pandas ». Donc, nous accédons à une méthode de pandas. Le «dataFrame ()» est le mot-clé de cette fonction qui, lorsqu'il est invoqué, génère un dataframe. Nous faisons un dataframe en utilisant ce «PD.Méthode DataFrame () »et initialisez-les avec une seule colonne« num ». Cette colonne contient deux valeurs qui sont «4» et «5». Appeler le «PD.La méthode DataFrame () »génère un DataFrame avec ces valeurs fournies.

Maintenant, pour stocker ce DataFrame, nous créons un objet DataFrame «V1». Le NEAT DATAFRAME NOUVELLEMENT généré est désormais accessible par cette variable «V1». Pour voir ce dataframe sur le terminal, nous utilisons la méthode «print ()». Ensuite, nous créons notre deuxième DataFrame en suivant les mêmes étapes mentionnées lors de la création du premier DataFrame «V1». Invoquez le «PD.DataFrame () ”pour créer un dataframe qui a été initialisé par une colonne ayant trois valeurs« r »,« s »et« t ». Pour stocker ce DataFrame, nous créons une variable «V2». Pour afficher la dataframe «v2», nous utilisons à nouveau la méthode «print ()».

Si vous êtes nouveau dans l'outil «Spyder», vous vous demandez peut-être comment vous allez exécuter le code. Pour exécuter ce fichier Python, cliquez sur le bouton "Exécuter le fichier" ou appuyez sur les touches "Shift + Enter". Maintenant, vous pouvez voir deux dataframes que nous venons de créer qui sont affichés sur le terminal de l'outil "Spyder".

La tâche principale commence à partir d'ici. Nous devons maintenant appliquer la jointure de croix sur ces deux dataframes. Pour effectuer une jointure croisée sur deux dataframes, il doit y avoir une colonne «clé» qui est présente dans les deux dataframes pour créer un lien entre eux afin que nous puissions les fusionner en l'utilisant. Comme nous pouvons le voir, il n'y en a rien, nous en ajoutons maintenant un dans les deux dataframes «v1» et «v2» qui est une colonne commune. Nous ajoutons la même colonne «clé» aux deux dataframes comme «v1 ['key] = 0» et «v2 [' key»] = 0 ». Maintenant, nous pouvons les fusionner sur cette colonne «clé».

Pour les fusionner, nous utilisons le «PD.Méthode Merge () ”. Entre ses parenthèses, nous fournissons à la fois des données de données «V1» et «V2». Le paramètre «ON» nous demande de donner le nom de colonne commun en fonction de laquelle nous pouvons les fusionner. Donc, il ressemble à «ON = 'key» ». Avec cette fonction, nous utilisons le «.Drop () ”Méthode pour supprimer la colonne« clé »une fois la fusion effectuée. La fonction «Drop ()» a deux paramètres - le nom de la colonne «clé» et «axe = 1», ce qui signifie que la goutte est en ce qui concerne la colonne. Nous créons un «magasin» variable pour maintenir la sortie du «PD.Fonction Merge () ”. Nous appelons la méthode «print ()» pour voir la sortie.

L'exécution du programme donné nous donne un dataframe qui a toutes les combinaisons de lignes possibles à partir du dataframe donné.

Exemple 2: Utilisation de Pandas PD.Méthode Merge () pour obtenir une jointure de croix entre deux dataframes avec plusieurs colonnes

Nous allons effectuer un autre exemple ici sur le même sujet, la croix de Pandas. Pour cela, nous lançons notre outil «Spyder» et ouvrons un nouveau fichier en appuyant sur le «Ctrl + N». L'exigence la plus importante du code est d'importer les bibliothèques nécessaires. Nous utilisons une méthode Pandas, nous importons donc la bibliothèque Pandas sous forme de PD. Maintenant, nous construisons notre premier DataFrame en utilisant le «PD.Méthode DataFrame () ».

Nous initialisons cette dataframe avec deux colonnes - «couleur» et «num». La colonne «Color» contient trois valeurs qui sont «rouges», «vert» et «bleu». Tandis que la colonne «num» a la même longueur de valeurs qui sont «101», «110» et «100». Nous créons une variable «P1» pour stocker la sortie de l'appel «PD.Méthode DataFrame () ». Maintenant, nous pouvons obtenir le DataFrame en utilisant cette variable. Nous utilisons la fonction «print ()» pour afficher le premier DataFrame sur le terminal.

Notre premier DataFrame est créé avec succès. Nous générons maintenant le deuxième Dataframe. Encore une fois, nous utilisons le «PD.Méthode dataFrame () »et créez une colonne dans ses parenthèses. Cette colonne «Serial» stocke quatre valeurs. Ces valeurs sont «C1», «C2», «C3» et «C4». Pour stocker ce DataFrame, nous créons une variable «P2». Ensuite, nous invoquons la fonction «print ()» pour afficher le dataframe «p2».

L'exécution du code Python précédent nous donne la sortie suivante qui affiche 2 DataFrames:

Nous générons une colonne «clé» dans chaque dataframe où nous pouvons les fusionner. Ici, nous utilisons la valeur «2» pour les colonnes «P1 [« clé »]» et «p2 [« clé »]». Enfin, nous invoquons le «PD.Fonction Merge () ”pour fusionner les dataframes sur les bases de la colonne« clé ». et le ".Drop () ”Méthode pour supprimer la colonne« clé »après avoir fusionné les deux dataframes. Nous créons une variable «peinture» pour stocker le dataframe fusionné. Le «print ()» est utilisé pour afficher la finale de données cross-jointe stockée dans «peinture».

Cela nous amène à la seule seule fois de données trans-jointe à la fusion de Dataframes.

Conclusion

La fusion de deux données de données dans un seulframe de données cross-jointe est une technique très facile et importante à apprendre. Cet article a souligné et expliqué le concept de la jointure de croix sur Pandas DataFrame. Nous avons élaboré sur chaque détail mineur du téléchargement de l'outil requis à la réalisation de la sortie souhaitée. Grâce à des exemples pratiques de codes Python implémentés et exécutés sur l'outil «Spyder», nous avons fait un effort intentionnel pour vous apporter un apprentissage fructueux et un concept facile à comprendre des pandas de Python.