Somme de pandas groupby

Nathan Blanc

Pandas fournit une variété de capacités utiles pour nous aider à convertir les données dans le format souhaité. L'un d'eux est la fonction groupby qui divise les lignes d'un dataframe en groupes en fonction des valeurs de colonnes particulières. Les pandas sont le meilleur outil pour ce cas car ils peuvent gérer la nature imprévisible des données réelles. La méthode «GroupBy ()» de Python pour Pandas est un outil sophistiqué et utile. Il vous permet de diviser vos données en plusieurs groupes et d'exécuter les calculs pour une analyse plus précise.

Méthode pandas sum ()

La somme des valeurs de l'axe demandée par l'utilisateur est renvoyée par la fonction sum (). Si la valeur d'entrée est un axe d'indexation, toutes les valeurs de cette colonne sont ajoutées. Cela s'applique à toutes les colonnes. Il en résulte une série qui contient le total des valeurs de chaque colonne. Vous pouvez utiliser directement la méthode Pandas Sum () sur les colonnes choisies à partir de la sortie du groupe Pandas pour obtenir la somme ou le total de chaque groupe. Cette méthode figure la somme des lignes et des colonnes de l'entrée.

Méthode pandas groupby sum ()

Il y a certaines étapes suivantes pour trouver le Pandas Groupby Sum ():

Créez un type de données qui est bidimensionnel, mutable et peut contenir de grands ensembles de données.
Affichez l'entrée DataFrame, DF.
Utilisation du DF. groupby sum (), trouver le groupe groupe (). Cette fonction trie les valeurs dans une colonne donnée. Les valeurs des autres colonnes sont ensuite triées en fonction des valeurs triées.
La somme pour le groupe.

Syntaxe pour la méthode groupby sum ()

Cette syntaxe de base est utilisée pour calculer la somme des valeurs dans la fonction groupby sum ().

Exemple 1: Créez un objet Groupby à l'aide de DataFrame

Nous avons besoin d'un logiciel ou d'outils pour nous donner une plate-forme où nous pouvons exécuter ce programme pour mettre en pratique l'exemple de codes Python. Ainsi, l'outil «Spyder» est utilisé. Nous devons ouvrir un nouveau fichier lorsque l'interface apparaît. Sur l'interface de l'outil «Spyder», nous avons choisi l'option «Nouveau fichier» pour effectuer le code. Il nous donne également des options supplémentaires pour ouvrir les fichiers. Par conséquent, vous pouvez également l'ouvrir en utilisant le «Ctrl + N».

Nous devons importer ces «pandas en tant que PD» pour exécuter le code Pandas. La section «PD» du code demande à Python d'attribuer à Pandas l'alias de «PD.Trame de données.groupBy () ”comme nom de fonction en tant que dataframe" groupBy () ". En utilisant Groupby, nous regroupons le Pandas DataFrame. La fonction Grouper choisit la colonne requise. À l'aide d'un mappeur ou d'un ensemble de colonnes, la fonction GroupBy () regroupe un DataFrame et renvoie un objet GroupBy. De grandes quantités de données dans ces groupes peuvent être combinées ou transformées en appliquant une variété de méthodes et de fonctions personnalisées dans des objets groupby.

Nous avons créé un dataframe dont la taille est «6, 2» et ses noms de colonne sont «Alphabet» et «valeur». Dans cet exemple, les variables que nous prenons sont «K», «L» et «M» et leurs valeurs sont «36», «21», «42», «8», «9» et «3». Pour appliquer les fonctions agrégées, la méthode «GroupBy ()» de Pandas regroupe les données similaires dans un groupe. Cette méthode renvoie un objet DataFrame GroupBy qui a des méthodes agrégées comme la somme et d'autres similaires. Le ”df.GroupBy ([«Alphabet»] », par exemple, ajoute toutes les colonnes de valeur dans un dataframe et calcule leurs sommes. L'utilisation du «groupe.Count () ”La méthode consiste à obtenir le compte pour chaque groupe, ignorant les valeurs non et nan pour regrouper les lignes par colonne. De plus, il fonctionne avec des données de type non flottant. Avec le nombre de valeurs pour chaque groupe d'un groupe, construisez une nouvelle série ou DataFrame.

Dans ce code, nous avons utilisé le «groupe.somme()". Cette fonction trie les valeurs dans une colonne donnée. Les valeurs des autres colonnes sont ensuite triées en fonction des valeurs triées. Cela crée une table dont les noms de colonnes sont «alphabet» et «valeurs» de l'alphabet qui est écrit sous l'alphabet et écrivez leurs valeurs devant eux. En utilisant le «groupe.sum () ”, les alphabets similaires combinent leurs valeurs et les font résumer. En utilisant le «groupe.sum () ”, les alphabets similaires combinent leurs valeurs et les font résumer.

Après avoir exécuté le code, il a montré son résultat dans lequel le «groupe.Count () ”Fonction a créé un tableau en comptant les« alphabets »et les« valeurs ». Dans la ligne suivante, il collecte les alphabets similaires et résume leurs groupes en utilisant le «groupe.SUM () ”Fonction. Maintenant, la valeur de «k» est «99», la valeur de «l» est «17», et la valeur de «m» est 3.

Exemple 2: Trouver et résumer la vitesse de certains animaux en utilisant la fonction groupby sum ()

Ce scénario est également comparable au premier. Pour les fonctions que nous avons utilisées dans l'exemple précédent, nous utilisons également la même chose dans ce code. Pour cela, nous avons créé un dataframe qui a deux colonnes. Le nom d'une colonne est «animal» et l'autre est «vitesse».

Dans ce code, nous avons également les mêmes fonctions que nous avions dans le programme précédent - le «groupe.count () »et« groupe.somme()". La somme de chaque groupe peut être obtenue en utilisant la méthode Pandas «SUM ()» directement sur les colonnes sélectionnées à partir de la sortie du groupe Pandas. Le DataFrame représente la fonction Pandas DataFrame. Dans la liste des animaux, nous avons pris trois animaux - «singe», «lion» et «tigre». Dans la deuxième colonne, nous avons écrit leur vitesse. Le DataFrame est divisé en groupes à l'aide de la méthode «DataFrame GroupBy ()». Il calcule le nombre de dénombrements de données similaires qui sont présents dans une colonne de dataframe spécifique.

En utilisant le «DF.groupBy () ”, l'objet est divisé, une fonction est appliquée et les produits sont combinés. Une grande quantité de données peut être regroupée en utilisant ceci et les opérations peuvent être calculées sur ces groupes. Vous pouvez regrouper vos données avec la méthode «GroupBy ()» et effectuer les opérations sur ces groupes. Le groupe.count () ”la fonction renvoie le nombre total de valeurs non nan. Un dataframe est renvoyé s'il y a plusieurs colonnes. Le comptage est la technique d'agrégation fondamental la plus simple. L'application de la fonction du comte Pandas à l'ensemble des données animales révèle rapidement combien de «singes», «lions» et «tigres» sont là dans le groupe «animal».

Examinez les résultats du fichier source, exécutez ce code et donnez une sortie veracieuse. Cette sortie affiche trois tables en utilisant trois fonctions différentes. Si nous comptons la vitesse de trois «singes», ce sera «105». La vitesse pour deux «lions» est «160» et la vitesse d'un «tigre» est «65».

Conclusion

Compte tenu de ces informations, cet article sert d'exemple de l'idée et de la nécessité de simplifier les choses pour vous. Nous avons défini deux fonctions ici. Ce sont les applications du «groupe.sum () »et« groupe.Count ”Fonctions en pandas. Vous pouvez probablement comprendre à quel point le «groupe est incroyable et utile.sum () »et« groupe.count () »Les fonctions sont pour examiner les données. Dans ce tutoriel, nous avons vu comment combiner les mêmes données en utilisant le «DF.groupe »et les résumer. Nous avons fourni ce guide une bonne et simple explication de toutes les méthodes pour que vous soyez plus facile pour vous faire valoir. Vous pouvez choisir l'une des deux techniques disponibles en fonction de vos besoins, mais la maîtrise des deux est essentielle et améliore donc vos compétences Python Pandas.

Windows OS

Quelle est la différence entre Windows Top 10 Home et Pro

La version «Pro» est destinée aux utilisateurs professionnels et a plus d'outils administratifs, tan...

Julien Dumas

Python

Convertir une chaîne en json python

La fonction du module JSON, la fonction du module «AST», ou la fonction «ev ()» est utilisée pour co...

Lena Martinez

Comment créer un cadre de données vide R

Tutoriel sur les différentes approches pour créer une dataframe vide à l'aide des données.Fonction (...

Lena Dupuy