Cette opération doit être effectuée sur un dataframe. Créons le dataframe avec sept lignes et cinq colonnes.
#Create un marché de dataframe qui a 7 lignes et 5 colonnes.Résultat
Maintenant, nous renvoyons les valeurs moyennes d'une colonne en regroupant les valeurs similaires dans une autre colonne.
Méthode 1: agrégat ()
Ici, nous utilisons la fonction agrégate () qui prend trois paramètres.
Syntaxe
agrégat (dataframe_object $ groupé, liste (dataframe_object $ groupement), fun = moyenne)Paramètres
Exemple 1
Dans cet exemple, nous regroupons les valeurs de la colonne Market_Place et obtenons les valeurs moyennes dans la colonne Market_SquareFeet regroupées par la colonne Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires (Australie, Inde et USA) dans la colonne Market_Place sont regroupées et renvoyaient la moyenne des valeurs groupées dans la colonne Market_Square Feet.
Exemple 2
Dans cet exemple, nous regroupons les valeurs de la colonne Market_Type et obtenons les valeurs moyennes dans la colonne Market_SquareFeet groupées par la colonne Market_Type.
Résultat
Nous pouvons voir que les valeurs similaires (bar, épicerie et restauration) dans la colonne Market_Type sont regroupées et renvoyaient la moyenne des valeurs groupées dans la colonne Market_Square Feet.
Exemple 3
Dans cet exemple, nous regroupons les valeurs dans les colonnes Market_Type et Market_Place et obtenons les valeurs moyennes de la colonne Market_Squarefeet regroupées par les colonnes Market_Type et Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires des deux colonnes ont été regroupées et ont rendu la moyenne des valeurs groupées dans la colonne Market_Square Feet.
Méthode 2: dplyr
Ici, nous utilisons le groupe_by avec SumMarise_at () qui sont disponibles dans la bibliothèque DPLYR pour effectuer le groupe_by avec l'opération moyenne.
Syntaxe
dataframe_object%>% group_by (groupement)%>% summarise_at (varS (groupé), list (name = moyenne))Où:
group_by () prend un paramètre, je.e. colonne de regroupement
SumMarise_at () prend deux paramètres:
Enfin, nous résumons d'abord avec la moyenne et le chargement dans le groupe. Ensuite, nous chargeons la colonne groupée dans l'objet DataFrame.
Il renvoie un tibble.
Exemple 1
Dans cet exemple, nous regroupons les valeurs de la colonne Market_Place et obtenons les valeurs moyennes dans la colonne Market_SquareFeet regroupées par la colonne Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires (Australie, Inde et USA) dans la colonne Market_Place sont regroupées et renvoyaient la moyenne des valeurs groupées dans la colonne Market_Square Feet.
Exemple 2
Dans cet exemple, nous regroupons les valeurs de la colonne Market_Type et obtenons les valeurs moyennes dans la colonne Market_SquareFeet groupées par la colonne Market_Type.
Résultat
Nous pouvons voir que les valeurs similaires (bar, épicerie et restauration) dans la colonne Market_Type sont regroupées et renvoyaient la moyenne des valeurs groupées dans la colonne Market_Square Feet.
Conclusion
Il est possible de regrouper les colonnes simples ou multiples avec d'autres colonnes numériques pour renvoyer la moyenne de la colonne numérique en utilisant la fonction agrégate (). De même, nous pouvons utiliser la fonction groupBy () avec la fonction SumMarise_at () pour regrouper les valeurs similaires dans une colonne et renvoyer la moyenne des valeurs groupées par rapport à une autre colonne.