Cette opération doit être effectuée sur un dataframe. Créons le dataframe avec sept lignes et cinq colonnes.
#Create un marché de dataframe qui a 7 lignes et 5 colonnes.Résultat
Maintenant, nous retournerons les valeurs maximales dans une colonne en regroupant les valeurs similaires dans une autre colonne.
Méthode 1: agrégat ()
Ici, nous utilisons la fonction agrégate () qui prend les trois paramètres.
Syntaxe
agrégat (dataframe_object $ groupé, liste (dataframe_object $ groupement), fun = max)Paramètres
Exemple 1
Dans cet exemple, nous regroupons les valeurs dans la colonne Market_Place et obtenons les valeurs maximales dans la colonne Market_SquareFeet regroupées par la colonne Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires (Australie, Inde et USA) dans la colonne Market_place sont regroupées et renvoient le maximum des valeurs groupées dans la colonne Market_Square Feet.
Exemple 2
Dans cet exemple, nous regroupons les valeurs dans la colonne Market_Type et obtenons les valeurs maximales dans la colonne Market_SquareFeet regroupées par la colonne Market_Type.
Résultat
Nous pouvons voir que les valeurs similaires (bar, épicerie et restauration) dans la colonne Market_Type sont regroupées et renvoient le maximum de valeurs groupées dans la colonne Market_Square Feet.
Exemple 3
Dans cet exemple, nous regroupons les valeurs dans les colonnes Market_Type et Market_Place et obtenons les valeurs maximales dans la colonne Market_SquareFeet regroupées par les colonnes Market_Type et Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires de deux colonnes ont été regroupées et renvoient les valeurs maximales dans chaque valeur groupée dans la colonne Market_Square Feet.
Méthode 2: dplyr
Ici, nous utilisons le groupe_by avec SumMarise_at () qui sont disponibles dans la bibliothèque DPLYR pour effectuer le groupe Group_By avec MAX.
Syntaxe
dataframe_object%>% group_by (groupement)%>% summarise_at (varS (groupé), list (name = max)))Où:
Enfin, nous résumons d'abord avec max et le chargeons en groupe. Ensuite, nous chargeons la colonne groupée dans l'objet DataFrame.
Il renvoie un tibble.
Exemple 1
Dans cet exemple, nous regroupons les valeurs dans la colonne Market_Place et obtenons les valeurs maximales dans la colonne Market_SquareFeet regroupées par la colonne Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires (Australie, Inde et USA) dans la colonne Market_Place sont regroupées et renvoient le maximum de chaque valeur groupée dans la colonne Market_Square Feet.
Exemple 2
Dans cet exemple, nous regroupons les valeurs dans la colonne Market_Type et obtenons les valeurs maximales dans la colonne Market_SquareFeet groupées par colonne Market_Type.
Résultat
Nous pouvons voir que les valeurs similaires (bar, épicerie et restauration) dans la colonne Market_Type sont regroupées et renvoient les valeurs maximales dans chaque valeur groupée dans la colonne Market_Square Feet.
Conclusion
Il est possible de regrouper les colonnes simples ou multiples avec d'autres colonnes numériques pour renvoyer la valeur maximale de la colonne numérique à l'aide de la fonction agrégate (). De même, nous pouvons utiliser la fonction groupBy () avec la fonction SumMarise_at () pour regrouper les valeurs similaires dans une colonne et renvoyer les valeurs maximales des valeurs groupées par rapport à une autre colonne.