Table de pivot de pandas

Lena Martinez

Python fournit beaucoup de bibliothèques pour effectuer différentes tâches. Le «Pandas» est également une bibliothèque de Python. Nous utilisons cette bibliothèque pour manipuler et analyser les données. Nous pouvons facilement concevoir le dataframe dans «pandas». De plus, nous concevons également les «tables de pivot» en utilisant les fonctions des «pandas». Une table de pivot est une caractéristique des feuilles de calcul qui permettent divers arrangements de tableaux pour diverses perspectives de données identiques. Une technique interactive pour résumer un vaste volume de données est la «table de pivot». La méthode «pivot_table ()» de «pandas» nous aide à concevoir les tables de pivot en utilisant les données des dataframes. Nous pouvons définir son index, ses colonnes et ses valeurs à l'intérieur de la méthode «Pivot_Table ()» en fonction de notre choix ou de notre besoin. Nous pouvons également appliquer des fonctions d'agrégation à ces pivot_tables dans «pandas». Dans ce tutoriel, nous créerons la table de pivot en utilisant la méthode «pivot_table ()» et nous expliquerons cette «table de pivot» en détail.

Syntaxe

pandas.PIVOT_TABLE (DATAFRAME_NAME, VALEUR = VALEURS_NAMES, INDEX = INDEX_NAMES, COLUMNS = COLUMN_NAMES, AGGFUNC = 'MANQUE')

Nous ajoutons d'abord le nom du DataFrame dont nous voulons utiliser les données dans le tableau pivot. Ensuite, dans les valeurs, nous ajoutons les noms de ces colonnes que nous voulons ajuster comme valeurs du tableau pivot. Après cela, nous insérons les noms des colonnes du DataFrame que nous souhaitons définir comme index du tableau pivot. Maintenant, dans les colonnes, nous définissons les noms des colonnes que nous voulons ajuster comme noms de colonnes de la table pivot. Ensuite, nous pouvons également y ajouter la fonction d'agrégation. Maintenant, nous ferons le code «pandas» et afficherons la création de la table pivot dans nos codes. Regardons les exemples ci-dessous.

Exemple 01

Nous commençons cet exemple en plaçant «l'importation» pour importer les modules de «pandas» dans l'application «Spyder». Nous placons «Pandas en tant que PD» après le mot clé «Importer». Nous importons également une autre bibliothèque qui est la «Numpy» de la même manière. Nous placons «IMPORT» puis ajoutons le «Numpy As NP», donc, cela nous aidera à accéder aux méthodes de la bibliothèque «Numpy». Après avoir importé les deux bibliothèques, nous nous dirigeons vers la création du DataFrame. Le DataFrame est nommé «Depense_DF», puis nous utilisons la méthode «Pandas» «PD.DataFrame () »donc, cela nous aide à créer le dataframe.

Les données que nous ajoutons dans le "Depense_DF" contient trois colonnes qui sont nommées "Exp_id, Depense_Type et Money". Les données que nous ajoutons dans le «EXP_ID» sont «E1, E2, E3, E4, E5 et E6». Ensuite, dans le «Expense_Type», nous placons: «Logement, divertissement, transport, nourriture, factures et taxes». La dernière colonne est la colonne «en argent» que nous ajoutons: «1500 $, 1200 $, 200 $, 3000 $, 5000 $ et 2000 $». Maintenant, nous affichons simplement cette «dépense_df en utilisant« print () ». Le dataframe est créé et affiché. Nous n'avons pas encore utilisé la méthode «pivot_table ()». Tout d'abord, nous montrerons ce dataframe. Ensuite, nous appliquons la méthode «pivot_table ()» également dans cet exemple.

Nous obtenons le résultat de ce code dans l'application «Spyder» à l'aide des touches «Shift + Entrée» ou nous pouvons également utiliser l'icône «Exécuter» de cette application. Seule le dataframe est affiché ici dans le résultat et toutes les données sont ajoutées à ce DataFrame. Maintenant, nous appliquerons la méthode «PIVOT_TABLE» pour créer la table PIVOT en utilisant les données de ce DataFrame.

Nous ajoutons ces lignes données au code ci-dessus. Ici, vous pouvez voir que nous accédons à la méthode «pivot_table ()» de «pandas» en utilisant «pd» avec cette méthode. Après cela, nous ajoutons le nom de DataFrame comme premier paramètre. Ensuite, dans les «valeurs», nous avons réglé la colonne «Money» pour qu'elle s'affiche comme les valeurs dans les cellules du tableau pivot. Dans «l'index», nous définissons le «Exp_id». Ainsi, la colonne «EXP_ID» se convertira en index de la table de pivot. Nous ajustons également la «dépense_type» dans les «colonnes» afin que les valeurs de la colonne «de dépense_type» apparaissent comme les noms de colonne de la table de pivot.

Ensuite, nous appliquons également la fonction d'agrégation «Aggfunc» et la définissons sur «NP. sum ”qui ajoutera des valeurs. La «somme» est la fonction de la bibliothèque «Numpy» que nous obtenons en plaçant le «NP». Nous avons stocké cette «table de pivot» dans la variable «Table» et ajouté cette variable «Table» dans «Imprimer» pour afficher.

Voici la table pivot. Notez que les «noms de colonne» de cette table de pivot sont les valeurs de la colonne «EXPENSE_TYPE» du DataFrame. L '«index» de ce tableau de pivot est les valeurs du «EXP_ID» du DataFrame que nous avons créé ci-dessus. De plus, les «valeurs» qui sont ajoutées dans les cellules de ce tableau de pivot sont les valeurs de la colonne «monétaire» du dataframe.

Exemple 02

Nous importons à nouveau à la fois des «pandas» ainsi que des bibliothèques «Numpy» pour générer le nouveau code. Nous allons créer la table PIVOT après avoir lu le fichier CSV et convertir les données du fichier CSV en DataFrame. Ensuite, utilisez les données du DataFrame pour créer le tableau pivot. Essayons comment nous fabriquons la table de pivot en utilisant les données du fichier CSV. Après avoir importé les bibliothèques, nous utilisons la méthode «read_csv» des «pandas». Ensuite, ajoutez le nom du fichier CSV qui y lit les données de ce fichier CSV et stockez ces données sous la forme de DataFrame dans la variable «DF».

Ensuite, nous imprimons ce "DF". Nous plaçons également la méthode «Head (8)» avec cela afin qu'il affiche uniquement les premières lignes «8» du DataFrame. Après cela, nous utilisons la méthode «Pivot_Table ()» dans laquelle nous insérons le nom du DataFrame. Ensuite, nous avons mis deux index pour la table de pivot qui sont les colonnes «Order_ID et Unités» du DataFrame. Dans les «valeurs», nous placons les colonnes «montant» et «pays» du dataframe afin qu'elles soient ajoutées comme valeurs du tableau pivot. Dans la fonction d'agrégation, nous ajoutons le «NP. Sum ”Fonction. Cette table de pivot est stockée dans «Pivot_result» et nous affichons également le «Pivot_result» en utilisant le «print ()».

Le DataFrame, ainsi que la table de pivot, sont rendus dans ce résultat et vous pouvez facilement vérifier les index et les valeurs du tableau pivot. Toutes les valeurs et index de la table Pivot sont ajustés en conséquence car nous avons défini dans le code.

Exemple 03

Nous pouvons également créer une table de pivot avec de nombreuses méthodes d'agrégation. Ici, nous concevons le dataframe, puis nous avons créé le tableau pivot en suivant la même méthode dont nous avons déjà discuté précédemment. Dans la méthode "pivot_table ()", nous ajustez "emp_type" comme "l'index". Le «EMP_PAY» est défini comme les «valeurs» de ce tableau de pivot et nous ajoutons ici plusieurs fonctions d'agrégation et ce sont «la somme, la moyenne et le compte». Ainsi, toutes ces fonctions s'appliqueront aux valeurs du tableau pivot. Ce «pivot_table ()» est enregistré dans «résultat» et nous imprimons également le «résultat» pour afficher le tableau pivot sur le terminal.

Le DataFrame et la table Pivot sont tous deux illustrés ici. Dans le tableau des pivots, vous pouvez noter que les trois colonnes - «Sum, moyenne et comptage» - contient le résultat après avoir appliqué ces fonctions aux données du tableau pivot. Notez également qu'il écrit les mêmes valeurs une seule fois dans la colonne d'index et ne duplique aucune valeur d'index ici.

Conclusion

Dans ce tutoriel, nous avons étudié la «table de pivot» dans «Pandas». Nous avons discuté de ce qu'est une table de pivot, pourquoi nous utilisons cette table de pivot et comment créer ce tableau pivot dans "Pandas". Nous avons expliqué la méthode qui est la méthode «pivot_table ()» qui nous aide à créer la «table pivot» dans «pandas» en utilisant les données du dataframe. Nous avons également utilisé cette méthode «Pivot_Table ()» dans les codes «Pandas» également. Nous avons appliqué de nombreuses fonctions d'agrégation sur cette «table de pivot». Nous avons également développé la «table pivot» après avoir lu le fichier CSV dans ce tutoriel.

c Sharp

Qu'est-ce que le système.Espace de noms IO en C #

Système.IO est un espace de noms dans le C # qui fournit un ensemble de classes, de structures, d'én...

Julien Dumas

Base de données Oracle

Oracle Fusion est-il considéré comme mieux que SAP?

Oracle Fusion (ERP basé sur le cloud) a une interface conviviale, tandis que SAP (Cloud et ERP sur s...

Sarah Roux

golang

Introduction au langage de programmation de Golang

Golang est un langage de programmation open source développé par Google. Suivez cet article pour app...

Nathan Blanc