Union des pandas

Union des pandas

La fonction du panda «Index.Union () »est utilisé pour obtenir l'indice dans un ordre syndical comme dans le chapitre défini des mathématiques, où nous avons utilisé la fonction syndicale. Nous pouvons également trouver l'union de l'indice en utilisant la fonction «Concat ()», qui combine le dataframe et définit l'ordre d'index d'une manière séquence.

La syntaxe pour la méthode Concat ()


La syntaxe pour «l'index.Méthode Union »


Exemple 1: L'union de deux index DataFrame à l'aide de la méthode Concat ()

Dans cet exemple, nous utilisons la fonction «Concat ()» pour «Union» les index de deux données de données. Concaténer deux données de données ensemble est un processus simple. Bien que la fonction «union» dans les pandas soit similaire à un syndicat, elle élimine également les doublons. Concat et la fonction des doublons de dépôt dans les pandas utilisent tous deux l'Union. Cette fonction syndicale fonctionne de manière similaire à ce que la fonction syndicale dans le chapitre des mathématiques «ensemble» fonctionne, combinant tous les nombres séquentiellement; Cependant, en pandas, le nombre répété est abandonné.

Nous utilisons l'outil «Spyder» pour implémenter le code dans le premier exemple de l'article. L'étape initiale de chaque code Python Pandas est d'importer la bibliothèque du Panda en tant que «PD».


Nous allons maintenant générer un dataframe. Pour concaténer les dataframes et appliquer un syndicat sur leurs indices, deux dataframes seront créés. Le premier dataframe que nous avons est nommé «Table1». Il contient deux colonnes, les «cours» et les «frais», chacun a certaines valeurs qui y sont énoncées. Dans la première colonne, nous énumérons les noms de quelques cours de programmation, notamment «OOP», «Python», «Java» et «Android Studio». Nous avons mentionné les frais de cours dans la deuxième colonne, «Fee», et ils sont «30000», «35000», «32000» et «25000». Pour générer notre premier DataFrame «Table1», nous utilisons maintenant «PD.DataFrame », comme vous pouvez le voir dans l'image suivante:


La création de la deuxième dataframe «Table2» est le stade suivant. Les noms de colonne de ce DataFrame sont les mêmes que ceux de la DataFrame précédente, mais leurs valeurs diffèrent. Nous avons «Graphic Design», «PHP», «SQL» et «Swift» dans la colonne «Courses», et nous avons «34000», «32000», «22000» et «24000» dans les «frais» colonne. Pour la génération du deuxième DataFrame, Table 2, nous utilisons à nouveau «PD.dataframe »comme démontré.


Maintenant, dans cette section, nous implémenterons la fonction principale de nos exemples, qui combine deux dataframes en utilisant la fonction «concat ()» et appliquant la fonction «Union» à leurs index. La méthode «concat ()» concaténe les éléments pandas sur un certain axe avec une logique de définition facultative, qui peut être l'intersection ou l'union avec les autres axes. Ici, nous avons utilisé «PD.CONCAT (TABLE1, TABLE2) ”pour combiner le dataframe. Nous avons également passé le paramètre «ignor_index = true» parce que nous ne voulons pas que l'index soit répété. Au lieu de cela, nous voulons l'index sous forme incrémentielle lors de la combinaison des dataframes. Enfin, nous avons enregistré le résultat dans la variable syndicale et l'avons imprimée en utilisant la fonction «print ()». Par conséquent, la méthode «Concat ()» utilisera essentiellement l'indice pour trouver l'union du DataFrame.


Passons à sa sortie, qui est montrée dans l'image suivante. Comme nous pouvons le voir, la combinaison de nos données de données a fonctionné avec succès en utilisant la fonction «Concat ()». Les deux colonnes, «cours» et «frais», sont affichés. Étant donné que notre index n'est pas répété, il est affiché dans la mousse de l'union, comme on peut le voir, car nous avons passé le paramètre de la fonction "Concat ()", qui est "ignore_index = true". La taille de l'indice que nous avons actuellement est «8», ce qui signifie qu'elle s'étend sur une gamme de «0 à 7».

Exemple 2: combinant l'index en utilisant l'index.Union () Méthode

Ceci est un exemple simple et compact. Avant de fusionner les deux index dans cet exemple, nous avons utilisé «l'index.Union () »Méthode. Comme toujours, nous devons importer la bibliothèque du Panda comme «PD» avant d'exécuter ce code. Dans cet exemple, nous construisons simplement un index plutôt qu'un dataframe. Donc, pour créer le «Index1» initial, nous avons utilisé «PD.Index »avec les nombres« 4 »,« 5 »,« 6 »et« 7 », et nous avons suivi la même procédure que vous pouvez le voir pour« l'index2 ». Les valeurs «index2» sont «8», «9», «10» et «11».


Comme vous pouvez le voir, nous utilisons actuellement «Index1.Union (Index2) ». Il créera une commande syndicale en combinant les deux indices. Nous utilisons ensuite la méthode «print ()» pour afficher le résultat généré.


Le résultat de sortie montre que l'index combiné commence au numéro quatre et se termine au numéro onze. Cette fois, une seule ligne de l'index s'affiche. Il indique également que son type de données est «int64».

Exemple 3: une union de trois indices de dataframe à l'aide de la méthode Concat ()

Cet exemple est similaire au premier exemple, mais celui-ci combinera trois dataframes et commandera leurs index séquentiellement. En général, l'index de Python renvoie l'emplacement de l'élément fourni dans une liste ou les caractères d'une chaîne. L'index définit essentiellement la position de l'élément, pour le dire simplement.

Nous devons importer la bibliothèque Pandas comme «PD» avant de commencer à écrire le code pour cet exemple. Dans ce scénario, trois dataframes doivent être créés. Le premier DataFrame que nous avons est nommé «Data1», et il a trois colonnes «Student_name», «Marks» et «Remarques». Certaines valeurs ont été ajoutées à ces colonnes. Nous avons «Noah», «Emma», «Enna» et «George» dans la première colonne, «Student_name», et dans la deuxième colonne «Marks», nous avons une liste des marques de l'étudiant «450», «490 »,« 482 »et« 209 »et la colonne finale contient les« remarques »de l'élève soit un« pass »ou un« échec ». Maintenant, nous créons cette dataframe comme indiqué en utilisant "PD.trame de données".


Il est temps de construire un deuxième DataFrame avec trois colonnes, qui seront identiques au premier, mais les valeurs des colonnes sont modifiées. Le DataFrame est nommé «Data2». Nous avons trois colonnes «Student_name», «Marks» et «Remarques». Dans la première colonne, «Student_name», nous avons «Watson», «Henry», «James» et «Oliver» les valeurs dans la deuxième colonne, «Marks», nous avons «499», «390», «290 »Et« 400 »et dans la dernière colonne, nous avons les remarques« passer »ou« échouer ». Cette dataframe «data2» est terminée, nous utilisons donc le même «PD.dataframe »pour produire cela.


Il est temps de créer le troisième DataFrame «Data3», qui a trois colonnes avec les mêmes noms que le dernier DataFrame mais avec des valeurs différentes. Les valeurs que nous avons dans la première colonne sont «Archie», «Ethan», «Michael» et «Samuel». Nous avons «230», «498», «290» et «403» dans la deuxième colonne, et dans le troisième, nous avons «échouer», «passer», «échouer» et «passer». Pour générer le troisième DataFrame «Data3», nous utilisons à nouveau «PD.trame de données".


Ici, nous combinons nos trois dataframes et nous attribuons à leurs index une séquence en termes d'union en utilisant la fonction «Concat ()» avec son paramètre. Ici, nous utilisons «PD.CONCAT (DF1, DF2, DF3) »est utilisé pour combiner les dataframes, qui sont les« données1 »,« data2 »et« data3 ». Comme vous pouvez le voir, nous utilisons également «ignore_index = true», qui omettra l'indice répété et leur fournira un nouvel index qui est exact et dans le bon ordre car nous désirons un ordre syndical pour notre indice. Définissez l'option «ignore_index = true» pour instruire la concaténation pour ne pas tenir compte de tous les indices actuellement utilisés. Ensuite, il définira l'index à partir de «0» pour continuer dans les résultats. Pour stocker le résultat produit par cette fonction, nous initialisons la variable «Union». Par la suite, nous invoquons la fonction «print ()» pour afficher le contenu stocké dans cette «union»:


Les dataframes sont combinés et illustrés comme une seule données de données dans la sortie, comme on peut le voir. Les trois dataframes sont combinés en utilisant la fonction «concat ()» et son union de leurs index en utilisant le paramètre «ignore_index = true». En raison du même nombre de colonnes et des mêmes noms de colonnes dans chacune de ces trois dataframes, aucune colonne supplémentaire n'a été affichée dans le résultat. Le «Student_name», les «marques» et les «remarques» sont les trois colonnes affichées après la concaténation. La représentation par un syndicat de l'indice est visible; Il commence à partir de «0» et se termine à «11», indiquant que la taille de l'indice est «12».

Conclusion

Dans cet article, nous avons concaténé le DataFrame pour obtenir l'indice syndical en utilisant la fonction «Concat ()». Nous utilisons également le paramètre de la fonction concat «ignor_index = true» parce que nous ne voulons pas l'index répété. Dans le deuxième exemple de l'article, qui est bref et simple, nous avons utilisé «l'index.Union () ”Fonction pour combiner les index et afficher le type de données de l'index. Nous pensons que ces méthodes simplifieront votre tâche.