Pandas Dataframe Pivot

Pandas Dataframe Pivot
Pandas est la bibliothèque de Python. Nous utilisons des pandas à de nombreuses fins. Nous pouvons faire le DataFrame dans Pandas et Pivot qui a donné DataFrame. Pour privo ou remodeler le dataframe, les pandas fournissent la méthode «pivot ()». Une dataframe spécifiée peut être réorganisée à l'aide de la méthode «Pivot ()» via l'index et les valeurs de colonne spécifiées. Lorsque nous voulons remodeler le dataframe, nous utilisons la méthode «pivot ()». Lorsque nous utilisons la méthode «pivot ()», il doit utiliser la valeur d'index unique. L'agrégation de données n'est pas prise en charge par la méthode «Pivot ()»; Plusieurs valeurs produisent un multiindex dans les colonnes. Dans ce guide, nous explorons en détail la méthode «Pivot ()» dans Pandas en détail. Et nous vous donnerons une démonstration visuelle des codes où nous remontons le dataframe en utilisant "pivot ()".

Syntaxe:

Trame de données.pivot (self, index = non, colonnes = aucun, valeurs = aucun)

Exemple 1:

Nous montrerons l'exemple pratique de la méthode «pivot ()» dans Pandas. Nous faisons le code Pandas dans l'application «Spyder». Comme nous le savons, nous devons importer certaines fonctions des pandas en tant que «PD». Nous développons ce code, nous appliquons donc la méthode «pivot ()». Cette méthode est appliquée au dataframe. Nous créons d'abord le dataframe ici. Le dataframe que nous développons ici est nommé «CARS_DATA» où nous ajoutons les données liées aux voitures. Nous faisons la première colonne avec le nom «car_name» où nous ajoutons quelques noms de voitures telles que «Wagonr, Swift, Lexus, Mehran, Mustang, Alto et Jaguar».

Nous insérons également plus de colonnes qui sont nommées «car_model, car_no et challan». Les données de ces colonnes sont également insérées ici. La colonne «Car_Model» contient les numéros de modèle des voitures qui sont «2014, 2001, 2010, 2015, 2020, 2012 et 2019». La colonne «Car_No» contient «R123, R456, R162, R102, S127, W190 et Z345». Ensuite, nous avons la colonne «Challan» où nous ajoutons les valeurs «500, 4000, 500, 6000, 2000, 1000 et 2000». Il s'agit de la fragilité complète qui contiennent quatre colonnes. Après cela, nous définissons les valeurs d'index pour les lignes qui sont «R1, R2, R3, R4, R5, R6 et R7». Nous insérons ces valeurs d'index à la «CARS_DATA» en utilisant la méthode «Index».

Ensuite, nous l'avons mis dans la méthode «print ()» pour rendre sur la console. Nous ne remodelons pas le dataframe ou n'appliquons pas encore la méthode «pivot ()». Nous affichons simplement le Dataframe «Cars_data».

Nous appuyons sur «Shift + Entrée» pour exécuter ce code. Après avoir appuyé sur ces touches, nous obtenons le résultat donné du code qui affiche le DataFrame que nous avons développé dans le code Pandas. Maintenant, nous appliquons la méthode «pivot ()» à ce dataframe et les remodeler en fonction de notre choix.

Ici, nous ajoutons ces lignes à notre code Pandas et utilisons la méthode «pivot ()». Cette méthode «pivot ()» contient trois paramètres. Dans le premier paramètre, nous définissons le nouvel index qui est le "car_model". Le deuxième paramètre est le nom de colonne que nous avons défini ici comme «Challan». Et le troisième paramètre est le paramètre de valeur que nous en tant que «car_name». Maintenant, le dataframe «CARS_DATA» est remodelé et apparaît comme nous avons défini. La colonne «Car_Model» apparaît sous forme d'index, la colonne «Challan» apparaît comme les noms de colonne, et les valeurs du dataframe sont le «car_name».

Ici, la dataframe remodelée apparaît et tous les ajustements des valeurs apparaissent en conséquence que nous avons définis dans le code. L'index dans ce dataframe remodelé est le «car_model». Le nom de la colonne ici est la colonne «Challan». Tous les «car_name» sont ajustés ici comme les valeurs. Le «nan» apparaît ici dans la cellule vide.

Exemple 2:

Le dataframe que nous développons dans cet exemple est le "new_interview_df". Mais nous créons d'abord une liste imbriquée avec le nom «new_interview». Et puis, nous convertissons cette liste imbriquée en DataFrame. La liste «new_interview» contient la «pro_language» où nous avons le «Java, C #, Python, Oop et Python». Il a «Code_Office» où nous mettons les «Bar12, Lon34, Par33, Lon56, Bar53, Lon11 et Bar34». Ensuite, nous avons le «EMP_SALARY» et insérons les «18000, 25000, 20000, 15000, 34000, 22000, 31000 et 43000». Le «New_Interview» est transformé en «new_interview_df» avec l'aide du «PD.Méthode DataFrame ». Nous mettons également la méthode "new_interview_df" dans la méthode "print ()". Il apparaît sur la console après l'exécution.

Maintenant, nous remontons le "new_interview_df" avec l'aide de la méthode "pivot ()". Cette fois, nous mentionnons la méthode «Valeurs, index et colonne» à l'intérieur de la méthode «Pivot ()». Ici, nous définissons le «EMP_SALARY» comme valeurs, «code_office» comme index et «pro_language» comme colonnes. Ensuite, nous imprimons ce Dataframe remodelé.

L'original, ainsi que les dataframes remodelés, apparaissent ici. Vous remarquerez peut-être que la valeur, l'index et les noms de colonne sont modifiés et qu'un nouveau dataframe remodelé apparaît ci-dessous. Dans le dataframe de Remhaped qui est apparu ici, l'index est le «code_office», les noms de colonnes sont «pro_language», et les valeurs sont la «EMP_SALARY».

Exemple 3:

Nous créons à nouveau une autre liste pour cet exemple. Cette liste est nommée «Temp_list» qui contient «Mois, ville, température et humidité». Le «mois» que nous insérons ici est «janvier, mai, juin, février et juillet». La «ville» a «New York, Birmingham, Mumbai, Baljiam et Bangalore». Dans la «température» et «l'humidité», nous ajoutons les «62, 68, 70, 77, 69» et «60, 66, 69, 74, 63», respectivement. Ensuite, nous modifions la "Temp_list" en "Temp_df" DataFrame. Nous rendons ensuite ce "temp_df" ici.

Maintenant, nous voulons pivoter ou remodeler ce "temp_df". La méthode «pivot ()» ici aide à le faire. Nous définissons le «mois» comme index et la «ville» comme nom de colonne. Les valeurs que nous fixons ici sont à la fois «température» et «humidité». Ils apparaissent comme deux données de données distinctes avec des valeurs différentes.

Ce résultat montre qu'après le remodelage, il y a deux dataframes séparés par des points. Le premier DataFrame contient les valeurs de «température» et la deuxième DataFrame contient les valeurs de «l'humidité». Les index et les noms de colonne pour les deux dataframes sont les mêmes. L'indice pour les deux dataframes est le «mois» et les «colonnes» pour les deux est «ville».

Exemple 4:

Ce code contient un «DF» DataFrame où nous placons «A01» comme première colonne et ajoutant «James, James et Mina». La deuxième colonne est «A02» qui a «l'ingénieur, l'ingénieur et l'enseignant». La troisième colonne est nommée «A03» où nous avons mis «44, 63, 21». Nous imprimons le «DF» et appliquons le «pivot» ici. Le «A01» est l'index, «A02» est la colonne et «A03» est la valeur. Maintenant, vérifiez la sortie de ce qui se passe avec ce DataFrame.

Voici le résultat de ce code. Vous remarquerez peut-être que le message d'erreur apparaît dans la sortie qui indique que l'index contient les entrées en double. Cela signifie que nous ne définissons pas ces colonnes comme un index qui contient les entrées en double car les index sont des valeurs uniques. Alors, soyez prudent à ce sujet tout en pivotant n'importe quelle dataframe.

Conclusion

L'objectif de ce guide est de rendre la logique de la fonction «Pandas Pivot ()» plus compréhensible pour vous. Nous avons décrit ce concept en profondeur afin qu'il vous soit facile d'appliquer la fonction «pivot ()» dans le code Pandas. Nous avons expliqué la méthode «pivot ()». Nous avons utilisé cette méthode pour remodeler ou pivoter le dataframe dans pandas. Nous avons également expliqué sa syntaxe ici. Dans ce guide, nous avons examiné quatre exemples descriptifs et pratiques, en regardant soigneusement chaque ligne de code. Nous avons fourni le résultat pour chaque code ici avec les scripts.