Pandas Groupby Max

Pandas Groupby Max
«Panda» est une bibliothèque Python. Le «groupe» est utilisé pour regrouper les données composées d'une ou plusieurs colonnes selon les catégories fournissant des étiquettes à chaque cartographie de groupe. Dans Pandas Python DataFrame, si vous souhaitez trouver la valeur «max» d'un groupe particulier comme vous en avez besoin, vous pouvez le faire simplement en utilisant la fonction «Group By () et Max ()». Cela aide à trouver les valeurs max sans bousculade comme dans les entreprises; Les données sont à grande échelle qui devient difficile à gérer. Et si vous souhaitez trouver un domaine spécifique à partir de toutes les données? Il devient difficile de faire les statistiques par vous-même. Il consommera beaucoup de temps ainsi que la patience d'un particulier donc au lieu de cela, utilisez les fonctions de Groupby Max dans Pandas DataFrame. Dans Pandas Python DataFrame, si vous souhaitez trouver la valeur «max» du groupe, vous pouvez le faire simplement en utilisant la fonction «Groupe By () et Max ()»."

Syntaxe
# df.groupBy ('Column_name').Max ()

Le «DF» représente le DataFrame ici, le Groupby a suivi le nom de la colonne où vous devez écrire le nom de la colonne sur laquelle vous souhaitez travailler. «Max» écrit à la fin, est pour la détection des valeurs max dans la colonne sélectionnée dans «DF."

Le groupby max des colonnes simples et multiples en pandas peut être effectuée de différentes manières. Faisons-les un par un.

Nous discuterons et couvrirons toutes les manières suivantes:

  • Groupby Max - colonne unique
  • Groupby Max - plusieurs colonnes
  • Groupby Max - Utilisation de la fonction de pivot
  • Groupby Max - en utilisant une fonction agrégée
  • GroupBy Max - Utilisation de la fonction reset_index (colonnes simples et multiples)

Création du DataFrame pour l'implémentation de la fonction Groupby Max

Tout d'abord, créons une dataframe pour appliquer les fonctions et comprendre clairement chaque méthode. Le «DF» Dataframe est composé de villes, de produits et de leurs ventes. Nous avons besoin d'un outil Python pour exécuter nos codes. Ici, le logiciel utilisé est Spyder pour l'implémentation. Vous devez d'abord le télécharger directement depuis Google, répondre aux besoins d'installation après le processus d'installation et lancer l'outil. Ouvrez le fichier et commencez à exécuter votre code, ce qui est facile au fur et à mesure. La description de toutes les façons d'utiliser le code Groupby Max Panda Python est définie brièvement dans les exemples ci-dessous.

Pour le domaine Python, les pandas en tant que «PD» et Numpy comme «NP» sont les bibliothèques importées dans l'exemple de code. Le Numpy est utilisé pour les données numériques dans Python, tandis que les pandas sont utilisés pour l'interprétation des données.

En utilisant la ligne de code suivante, nous travaillerons sur chacun des exemples couvrant:

# df1 = pd.DataFrame (données, colonnes = [«villes», «produits», «ventes»])

Selon le DataFrame, les colonnes sont des villes, des produits et leurs ventes; De même, la syntaxe se compose des trois dans la représentation de la colonne.

Le code devrait apparaître comme celui-ci sur l'écran de la console.

La sortie montre la liste des colonnes composées de villes, de produits et du NO des ventes. Il montre également le numéro de série en particulier.

Exemple # 01: Groupby Max Pandas - Colonne unique

Démarrage de l'implémentation pratique de la colonne unique Groupby Max à l'aide du code Python dans Pandas DataFrame, nous avons besoin d'un outil spécifique, et pour cela, nous utiliserons Spyder, comme mentionné précédemment dans la description ci-dessus. Maintenant, après avoir ouvert Spyder sur votre ordinateur portable / bureau, vous avez besoin de l'extension de fichier comme «.Py ”C'est la référence Python parce que notre code est en langue python.

Maintenant, en commençant la partie du code, il y a un mot panda qui est également le premier mot de notre article, ce qui signifie que quelque chose avec la bibliothèque de Pandas devrait être implémenté pour cela; Nous devons écrire «Panda» comme «PD», qui importera toutes les fonctionnalités de la bibliothèque Panda dans notre fichier de travail.

La colonne unique Groupby Max fonctionne en appelant «GroupBy ()» et en écrivant le nom de la colonne que vous souhaitez de votre DataFrame, qui est «Cities» dans le «DF» suivi de sélection du champ pour l'estimation maximale «Max () " fonction.

La sortie est la colonne unique «villes» telles que nous avons sélectionnées, montrant les valeurs max de chacun.

Exemple # 02: Groupby Max Pandas - plusieurs colonnes

Maintenant, ouvrez le nouveau fichier pour l'exemple d'implémentation de plusieurs colonnes dans Groupby Max car vous pouvez trouver la valeur maximale de chaque groupe se référant à différentes colonnes de votre «DF» dans Pandas Groupby Max. Sélectionnez les colonnes; Ici, vous pouvez sélectionner plusieurs colonnes car elle soulève les plusieurs colonnes de votre «DF» selon votre besoin.

Le code utilisé pour le multiple Groupby Max est:

La sortie, comme vous pouvez le voir, affiche les valeurs maximales des deux colonnes.

Exemple # 03: Groupby Max Pandas - Utilisation de la fonction de pivot

Encore une fois, ouvrant un nouveau fichier pour l'exemple de travail de la fonction pivot dans Groupby Max Pandas. La fonction pivot () consiste à organiser votre «DF» sous une belle forme représentable. Vous pouvez y travailler avec des colonnes simples ou multiples comme vous le souhaitez. Ici, l'implémentation est sur plusieurs colonnes GroupBy, mais si vous souhaitez faire le Panda Panda GroupBy MAX MAX PANDA, vous devez ajouter une colonne dans GroupBy () ajouter au lieu de plusieurs colonnes; Vous pouvez également obtenir la représentation de colonne simple.

Le code PIVOT () dans Pandas Groupby Max est:

En utilisant la fonction pivot (), l'affichage de sortie ressemble à des individus réglés.

Exemple # 04: Groupby Max - en utilisant une fonction agrégée

Vous devez ouvrir un autre fichier à partir du fichier et accéder au nouveau fichier. Maintenant, nous recherchons l'exemple en utilisant la fonction agrégée dans le groupe par Max Pandas. La fonction agrégée dans le code, que nous écrivons en tant qu'ag (), fonctionne en prenant le «max» comme entrée, qui effectuera le groupe Groupby dans votre «DF» et fera une structure définie de votre «DF».

Le Panda max groupby max pour le code de colonne multiple est:

La fonction AGG () permet à toutes les colonnes d'agrégation possible avec les valeurs max.

Exemple # 05: Groupby Max - Utilisation de la fonction Reset_index (pour les colonnes simples et multiples)

L'index de réinitialisation par son nom explique que sa fonction réinitialise l'index et fournira également un nouvel index à DataFrame en en faisant une structure plus appropriée.

Le code de la fonction reset_index unique dans les pandas est:

Ici, la réinitialisation du «DF» se fait avec la fonction réinitialisée () de la colonne sélectionnée, qui est des villes affichant les valeurs max.

Pour les multiples colonnes reset_function dans pandas, le code est:

La sortie affiche les deux colonnes réinitialisant le «DF» dans les pandas à l'aide de la fonction réinitialisée () groupby max.

Conclusion

La fonction Panda Groupby Max est très utile et simpliste. Car il peut détecter la valeur maximale de la colonne de sélection à l'aide du «.fonction max () ”et peut calculer le maximum des valeurs dans le dataframe. Dans cet article, nous avons expliqué toutes les méthodes par lesquelles la fonction max () fonctionne GroupBy (), i.e., Groupby Max sur des colonnes simples et multiples, et nous pouvons réinitialiser l'indice des deux, de la même manière que l'agrégat et la fonction de pivot fonctionnant à sa meilleure explication avec des exemples pour une meilleure compréhension. Chaque partie de ce tutoriel met l'accent sur la compréhension et la compréhension faciles des concepts.