Pandas démêler

Pandas démêler
«Un bon nombre d'algorithmes incorporés pour modifier un ensemble de données sont applicables dans les pandas. Parmi tous, probablement les deux algorithmes les plus populaires pour les colonnes et les lignes de jumelage sont «Stack ()» et «Unstack ()». Au niveau 0 de l'ensemble groupé de données, nous utilisons sporadiquement le «Stack ()» et «Unstack ()». Nous avons l'intention d'examiner «déboucher» dans Pandas dans cet article. «Déborder» est l'une des positions importantes des pandas pour éliminer les bibelots de la pile. L'écraser est fortement utilisé dans les pandas pour modifier considérablement la forme du cadre de données démontré. Deux paramètres principaux de Pandas débouchants qui pourraient être utilisés «niveau» et «fill_value»."

La syntaxe pour la méthode de décrochage de pandas

Exemple 1: Affichage de Pandas démêler dans un cadre de données avec une simple fonction de décrocher en même temps

Nous allons maintenant discuter de la façon dont nous pouvons débarrasser de la trame de données dans Pandas. À cette fin, l'outil que nous avons utilisé en tant que compilateur de Pandas Python est «Spyder». Pour inclure l'implémentation des Pandas, nous avons importé la bibliothèque de Pandas comme «PD».

Examinons le code du premier exemple. Après avoir importé la bibliothèque du Panda, nous avons créé notre trame de données comme «Date_values», où nous avons attribué la date «index» comme «2022-08-21». La valeur attribuée pour les «périodes» est «120» et la valeur que nous avons attribuée à «Freq» est «2min». Les valeurs de colonne déclarées pour le cadre de données incluent «Données», «Colonnes» et «Index». Le phénomène de la fonction «liste» est appliqué aux «données» ainsi que la «plage» de la valeur en tant que «120». La variable «colonnes» stocke la valeur de caractère nommée «valeur». La valeur attribuée à la colonne «index» comme «index». Le cadre de données «Date_value» est attribué avec deux valeurs de colonne comme «positive» et «négative». La valeur «positive» sera attribuée de l'ordre supérieur à la trame de données par défaut, mais la valeur «négative» sera attribuée à la trame de données du «loc [0: 8]» de la valeur «positive». Après avoir attribué les valeurs aux colonnes de notre trame de données «data_values», nous avons simplement appliqué une fonction «print ()» juste pour afficher notre trame de données.

Voyons maintenant à notre fonction principale pour débarrasser de notre trame de données «Date_values». À cette fin, nous utilisons notre principale fonction «Unstack ()» sur notre trame de données «data_values». Pour le faire débarrasser, nous l'utilisons généralement comme «Date_values.unstack () ”avec le cadre de données. Après l'implémentation de la fonction principale, nous utilisons la fonction «print ()» dans le dernier pour afficher notre trame de données sous forme.

Jetons maintenant un coup d'œil à notre affichage de sortie, dans lequel nous pouvons voir que notre trame de données «Date_values» est segmenté en trois colonnes dans la première section. Le premier coin gauche a la valeur de date de «2022-08-21» avec l'intervalle de temps de «2min». Le nom de la colonne du milieu «valeur» a les nombres «index». Le nom de la colonne du coin droit «Value_2» affiche la valeur «négative» de haut en bas. Si nous regardons du bas en haut, il affiche la valeur de date identique à «2022-08-21» ainsi qu'un intervalle de temps de «2min», ayant le dernier numéro d'indexéré comme «119» car nous avons fourni la plage de «120 ". La colonne «Value_2» affiche la valeur «positive» du bas en haut. Après le cadre de données, nous pouvons voir qu'il montre le total des lignes «120» et des colonnes «2» que nous attribuons à notre trame de données dans le code.

Lorsque nous avons appliqué notre principale fonction «Unstack ()», il sépare la valeur de la pile, et nous pouvons voir qu'il affiche la valeur des nombres «index» séparément pour la colonne «valeur» contenant des lignes «120» avec Colonnes «2» de l'ordre de haut en bas. La colonne «Value_2» est affichée séparément avec les valeurs de date avec le temps d'intervalle «2min» montrant la valeur «positive» du bas en haut vers le «négatif». Après la mise en œuvre de la décrochage, la durée des lignes totales devient «240». Parce que la suppression de la valeur de la pile fait sa longueur totale sera «240».

Exemple 2: Affichage de Pandas Débrouiller dans le cadre de données en utilisant la fonction de désosser () à plusieurs niveaux

Nous allons maintenant discuter de notre deuxième exemple où après l'importation de la bibliothèque de Pandas comme «PD», nous avons créé notre trame de données nommé «Record». Le cadre de données «Enregistrement» a été déclaré avec trois colonnes de valeurs sous forme de «mobiles», «Sales_R1 dans $» et «Sales_R2 en $». Les valeurs stockées de la colonne «Mobiles» sont «iPhone», «iPhone», «Samsung» et «Samsung». Les valeurs attribuées à la colonne «Sales_R1 dans $» sont «10», «20», «30» et «40». Les valeurs attribuées à la colonne «Sales_R2 dans $» sont «12», «15», «16» et «18». Après avoir attribué les valeurs, nous les avons alloués sous forme de trois colonnes et appliquée simplement la fonction «print ()» pour afficher notre trame de données «Enregistrer» avec les trois colonnes contenant toutes les valeurs attribuées.

Après avoir créé notre DataFrame, premièrement, nous avons appliqué la fonction «Stack ()» sur notre trame de données «Enregistrer» en deux niveaux ainsi que les deux colonnes. Après cela, nous avons appliqué la fonction «Unstack ()» à plusieurs niveaux au même endroit. Tout d'abord, nous avons appliqué la fonction «Unstack ()» sur le cadre de données à «niveau = 0» et l'avons nommée «First_Stack» et l'avons affichée avec la fonction «print ()». Après cela, nous avons appliqué la fonction «Unstack ()» sur «niveau = 1» et l'avons nommée «second_stack» et l'avons affichée en appliquant la fonction «print ()» sur le dernier. C'est ainsi que nous pouvons appliquer une fonction démêlée à plusieurs niveaux en attribuant simplement la fonction «Unstack ()» au niveau où nous voulons supprimer la valeur de la pile.

Nous allons maintenant discuter de la sortie de notre deuxième exemple, où nous avons appliqué la fonction «Unstack ()» à plusieurs niveaux. Dans la sortie, tout d'abord, il affiche simplement le cadre de données «Enregistrer», que nous avons créé avec trois colonnes de «Mobiles», «Sales_R1 dans $» et «Sales_R2 dans $». Les numéros d'index varient de «0» à «3» et les valeurs affichées dans les premières colonnes sont «iPhone», «iPhone», «Samsung» et «Samsung». Les valeurs dans la deuxième colonne affichée sont «10», «20», «30» et «40». Les valeurs affichées dans la troisième colonne sont «12», «15», «16» et «18».

Lorsque nous avons appliqué la fonction «Stack ()», il a déplacé toutes les valeurs allant de «0» à «3» dans la pile séparément, ainsi que les deux valeurs de colonne. Dès le prochain après le cadre de données, nous pouvons voir les valeurs d'index «0», «1», «2» et «3» des deux colonnes toutes sont placées dans la pile. Lorsque nous appliquons la fonction «Unstack ()» au «niveau = 0», il supprime la valeur de la pile et affiche les valeurs entières des colonnes de manière horizontale avec toutes les valeurs dans les trois colonnes. Et lorsque nous avons appliqué la fonction «Unstack ()» sur le «niveau = 1», il affiche le cadre de données de la pile dans la forme d'origine car il était plus tôt avant d'entrer dans la pile de manière verticale avec toutes les colonnes et des valeurs qui ont été attribuées dans le code. Les deux derniers sont l'affichage de «First_Stack» et «Second_Stack» après l'implémentation de la fonction «Unstack ()» au «niveau = 0» et «niveau = 1». C'est la façon d'appliquer des phénomènes de débattement à plusieurs niveaux.

Exemple 3: Affichage de Pandas Débascule dans un cadre de données avec plusieurs fonctions de décalage () à différents niveaux de duplet

Dans notre troisième exemple, nous avons pris le même cadre de données «enregistrer» que nous avons utilisé dans l'exemple précédent pour afficher la fonction «Unstack ()» à deux niveaux différents. Tout d'abord, nous avons simplement imprimé le cadre de données «enregistrer» la même chose que dans le deuxième exemple. Pour appliquer la fonction «Unstack ()» à deux niveaux différents, nous avons d'abord fait le groupe d'une colonne en utilisant la fonction «GroupBy ()» ainsi que «Agg ()» de «Sum» et «Max» sur la colonne « Sales_r1 en $ ". "Sum" et "Min" sur la colonne "Sales_R2 dans $" et l'a nommé "groupé_data". Après cela, nous avons utilisé la fonction «print ()» avec «groued_data» pour l'afficher.

Après avoir regroupé deux colonnes avec «Sum», «Max» et «Min», nous avons appliqué la fonction «Unstack ()» sur «groued_data» à «(niveau = 0)» et l'avons nommée «first_unstack» et l'a affichée avec la fonction «print ()». Ensuite, nous avons appliqué la fonction «Unstack ()» sur «groued_data» à «(niveau = 1)» et l'avons nommée «second_unstack». Enfin, nous avons appliqué la fonction «print ()» sur «second_unstack» pour l'afficher.

Maintenant, en haut de l'écran de sortie, nous pouvons voir qu'il affiche simplement le cadre de données «enregistrer» la même chose que dans le deuxième exemple. Après cela, nous pouvons voir qu'il affiche deux colonnes principales «Sales_R1 dans $» et «Sales_R2 en $» ainsi que deux sous-colonnes de «Sum», «Max» et «Sum», «Min» ainsi que les valeurs de «30 30 »,« 70 »,« 20 »,« 40 »,« 27 »,« 34 »,« 12 »et« 16 ». Sur le côté gauche, il a des valeurs de colonne «Mobiles», qui sont «iPhone» et «Samsung». En utilisant la fonction «GroupBy ()», il a fusionné le long d'un groupe de deux valeurs communes de «iPhone» et «Samsung», que nous pouvons voir dans l'affichage de sortie avec des lignes «2» et des colonnes «6» ». Après la mise en œuvre de la fonction «Unstack ()» à deux niveaux différents de données groupées, il le supprime simplement de la pile, mais les données restent sous la forme groupée en raison de la fonction «GroupBy ()».

Conclusion

Dans notre article, nous avons utilisé deux cadres de données pour s'appliquer à la fonction démêlée. Dans notre premier exemple, nous avons appris comment nous pourrions nous appliquer à la mise à dos en même temps. Pour les deux autres exemples, nous avons utilisé les mêmes cadres de données. Dans le deuxième exemple, nous avons appliqué la fonction «Unstack ()» à plusieurs niveaux, tandis que dans le troisième exemple, nous avons appliqué la fonction multiple «Unstack ()» à différents niveaux de duplet en utilisant le phénomène de «groupby». Ces méthodes le rendront plus simple à comprendre si nous les appliquons tout en y travaillant.