Cette opération doit être effectuée sur un dataframe. Créons le dataframe avec sept lignes et cinq colonnes.
#Create un marché de dataframe qui a 7 lignes et 5 colonnes.Résultat
Maintenant, nous retournerons la médiane dans une colonne en regroupant les valeurs similaires dans une autre colonne.
Méthode 1: agrégat ()
Ici, nous utilisons la fonction agrégate () qui prend trois paramètres.
Syntaxe
agrégat (dataframe_object $ groupé, liste (dataframe_object $ groupement), fun = médian)Paramètres
Exemple 1
Dans cet exemple, nous regroupons les valeurs de la colonne Market_place et obtenons la médiane dans la colonne Market_SquareFeet regroupée par la colonne Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires (Australie, Inde et USA) dans la colonne Market_Place sont regroupées et renvoyaient la médiane des valeurs groupées dans la colonne Market_Square Feet.
Exemple 2
Dans cet exemple, nous regroupons les valeurs de la colonne Market_Type et obtenons la médiane dans la colonne Market_SquareFeet regroupée par la colonne Market_Type.
Résultat
Nous pouvons voir que les valeurs similaires (bar, épicerie et restauration) dans la colonne Market_Type sont regroupées et renvoyaient la médiane des valeurs groupées dans la colonne Market_Square Feet.
Exemple 3
Dans cet exemple, nous regroupons les valeurs dans les colonnes Market_Type et Market_Place et obtenons la médiane dans la colonne Market_SquareFeet regroupée par les colonnes Market_Type et Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires des deux colonnes ont été regroupées et ont rendu la médiane dans chaque valeur groupée dans la colonne Market_Square Feet.
Méthode 2: dplyr
Ici, nous utilisons la fonction Group_By () avec SumMarise_at () qui sont disponibles dans la bibliothèque DPLYR pour effectuer la fonction Group_By () avec l'opération médiane.
Syntaxe
dataframe_object%>% group_by (groupement)%>% summarise_at (varS (groupé), list (name = median)))Où:
Enfin, nous résumons d'abord avec la médiane et le chargeons dans le groupe. Ensuite, nous chargeons la colonne groupée dans l'objet DataFrame.
Il renvoie un tibble.
Exemple 1
Dans cet exemple, nous regroupons les valeurs de la colonne Market_place et obtenons la médiane dans la colonne Market_SquareFeet regroupée par la colonne Market_Place.
Résultat
Nous pouvons voir que les valeurs similaires (Australie, Inde et USA) dans la colonne Market_Place sont regroupées et renvoyaient la médiane de chaque valeur groupée dans la colonne Market_Square Feet.
Exemple 2
Dans cet exemple, nous regroupons les valeurs de la colonne Market_Type et obtenons la médiane dans la colonne Market_SquareFeet regroupée par la colonne Market_Type.
Résultat
Nous pouvons voir que les valeurs similaires (bar, épicerie et restaurant) dans la colonne Market_Type sont regroupées et renvoyaient la médiane dans chaque valeur groupée dans la colonne Market_Square Feet.
Conclusion
Il est possible de regrouper les colonnes simples ou multiples avec les autres colonnes numériques pour retourner la médiane de la colonne numérique à l'aide de la fonction agrégate (). De même, nous pouvons utiliser la fonction groupBy () avec la fonction SumMarise_at () pour regrouper les valeurs similaires dans une colonne et renvoyer la médiane des valeurs groupées par rapport à une autre colonne.