Pandas agg

Pandas agg
«Pandas» fournit la fonction «agg ()». En utilisant la fonction «agg ()», nous pouvons utiliser différentes fonctions. Il est effectué sur l'axe d'index de ligne, qui est inséré automatiquement dans le dataframe. Le comportement par défaut des fonctions numpy «agg ()» (moyenne, médiane, prod, sum, std, var), qui évalue l'agg () du réseau aplati, est distinct de ce comportement. Nous pouvons ajouter des données à l'aide de la fonction AGG (). Ce guide utilisera la fonction «pandas agg ()» et montrera le fonctionnement de cette fonction «agg ()» dans «pandas».

Syntaxe

La syntaxe de cette fonction est:

#trame de données.AGG (Func, Axe, Args, Kwargs)

Exemple # 01

Nous avons l'application «Spyder» pour exécuter nos codes «Pandas». Lors du développement du code «pandas», nous devons «importer» les méthodes «pandas» comme le «PD». Ce «PD» nous permet d'accéder aux méthodes ou fonctions des «pandas» en ajoutant «PD» au lieu de «pandas». Nous générons les données et les stockons dans «Data1». Nous écrivons "x1" et dans "x1". Nous ajoutons «60», «50» et «40». Nous avons «Y1» et ajouté «900», «1212» et «51». Nous placons également "Z1". En cela, nous insérons «200», «300» et «800». Nous transformons cette «données1» en «DataFrame» et écrivons «PD» avec le «DataFrame» afin qu'il nous soutienne dans l'accès à cette fonction de «pandas».

Nous passons «Data1» comme paramètre du «PD.Trame de données ()". Il génère «DataFrame» pour nous et utilise également la variable ici «DFA» qui stocke ce dataframe dedans. Ensuite, nous ajoutons «imprimer (DFA)» pour rendre ceci. Ci-dessous, nous utilisons la fonction «AGG ()» pour effectuer certaines opérations sur ce DataFrame. Nous appliquons «somme» dans cette fonction «agg ()». Le résultat que nous obtenons après la somme est stocké dans la variable «ANS». Nous imprimons également cette somme en mettant le «print ()».

Nous colletons également la sortie ici. Cette sortie est extraite sur la borne «Spyder» en appuyant sur «Shift + Entrée». Il affiche d'abord les données lorsqu'elle est insérée dans le code et ajoute les valeurs de «x1», puis s'affiche dans «X1» ci-dessous. Les valeurs du «Y1» sont également ajoutées et le résultat est affiché dans la colonne «Y1». Enfin, l'opération de somme est également effectuée sur les valeurs du «Z1». Le résultat après le résumé est rendu dans la colonne «Z1».

Exemple # 02

Nous produisons le dataframe après avoir importé les «pandas» comme «PD». Le dataframe est nommé «données». Nous insérons d'abord trois lignes et ajoutons «9, 8, 7» à la première ligne; «4, 5, 6” à la deuxième rangée; et aussi «1, 2, 3» à la troisième rangée. Ensuite, nous insérons le nom de l'en-tête de chaque colonne en utilisant le mot-clé «colonnes». Nous attribuons «A1» comme en-tête de la première colonne. «A2» comme en-tête de la deuxième colonne. Et «A3» pour la troisième colonne. Nous imprimons les «données» sur le terminal de l'application Spyder.

Nous mettons le nom de la «données» DataFrame et utilisons la méthode «Agg ()» avec ces «données». Nous avons deux fonctions que nous voulons appliquer à la dataframe: «somme» et «min». «SUM» ajoutera les nombres de chaque colonne séparément. «Min» trouvera la valeur minimale de la colonne. Ensuite, il stockera la somme et la valeur min dans le «résultat» que nous avons créé. Enfin, il imprimera le «résultat» car nous avons également inséré «l'impression».

La somme de la colonne «A1» est «14» et la valeur minimale de cette colonne est «1». La somme de la deuxième colonne «A2» est «15». Sa valeur minimale est «2». La somme de la dernière colonne «A3» est «16» et la valeur minimale que nous avons pour cette colonne est «3» qui est affichée.

Exemple # 03

Nous répétons la première ligne de cet exemple et construisons le DataFrame «Info». Ensuite, mettez des données en lignes car «3, 8, 7» est insérée ici à la première ligne. «4, 1, 6” et «7, 2,3» sont insérés aux deuxième et troisième rangées respectivement. Nous attribuons également quelques noms d'index à toutes les colonnes en tant que «Col1», «Col2» et «Col3» pour la première, la deuxième et la troisième colonne respectivement. Nous rendons ces «informations» en utilisant «Print». Nous appliquons différentes agrégations aux colonnes.

Dans la méthode «agg ()», nous mentionnons le nom de la colonne, puis mettons l'opération que nous voulons appliquer à cette colonne mentionnée. Quant à «COL1», nous utilisons les opérations «Sum» et «Min». Sur le «COL2», nous appliquons des opérations «min» et «max». Mais nous ne mentionnons pas le «COL3», donc aucune fonction AGG n'est appliquée au «Col3». Nous utilisons également la variable «finale» pour stocker ce résultat, puis la rendre.

La «somme» et le «min» sont appliqués au «COL1» mais dans «Max», il imprime «Nan» parce que nous n'avons pas appliqué le «max» à ce «Col1». Ensuite, les valeurs «min» et «max» de «Col2» sont là, mais le bloc de somme contient «nan» car nous appliquons uniquement «Max» et «Min» à ce «col2». Le «Col3» n'est pas là parce que nous n'avons appliqué aucune méthode «agg ()» à cette «col3».

Exemple # 04

Nous appliquons différentes fonctions sur les colonnes et mettons également à jour le nom de l'index après le résultat. Pour cela, nous avons construit les «données brutes» de Dataframe et nous avons trois lignes contenant des nombres qui sont «22, 82, 27» dans la première ligne; «14, 23, 36» ici dans la deuxième rangée; et «77, 29, 34» est dans la troisième rangée. Les noms des colonnes que nous avons ajoutés sont «Data1», «Data2» et «Data2». Ci-dessous, nous avons la méthode «print ()».

Maintenant, nous utilisons la méthode «agg ()» du «pandas» et définissons «x» qui est utilisé pour renommer le nom de l'index de ligne après avoir appliqué la fonction d'agrégation à la colonne «Data1». Nous appliquons la fonction «max» à «data1». Nous sélectionnons «Y» pour remplacer le nom de l'index de ligne après avoir exécuté la fonction d'agrégation. À «data2», nous utilisons la fonction «min». Sur «Data3», nous mettons la fonction «moyenne» et définissons le nom de l'index de ligne sur «Z» qui est remplacé après avoir appliqué la fonction d'agrégation. Ensuite, nous avons également le «print ()» afin que le «calcul» soit affiché pour nous.

Sur «data1» seule la fonction «max» est appliquée et les deux valeurs restantes sont «nan». De plus, la valeur d'index est modifiée en «x». La colonne «Data2» affiche simplement le résultat de la fonction «min» et les valeurs restantes sont «nan» et son nom de ligne d'index est «y» pour cela. Maintenant, la seule moyenne est appliquée à «Data3» et son indice de ligne est modifié en «Z».

Conclusion

Ce guide est sur la fonction «Agg» dans «Pandas». Nous avons expliqué que la fonction «Agg» qui est utilisée dans les pandas pour appliquer différentes fonctions. Nous avons établi quatre instances, auxquelles nous avons appliqué la méthode «Agg».

.