Supprimer les lignes de trame de données

Supprimer les lignes de trame de données
Supposons qu'il existe une situation pour supprimer les lignes dans une trame de données R. Comment feras-tu cela?

Cet article montrera différentes façons de supprimer les lignes d'un cadre de données.

Créons un cadre de données du marché avec quatre lignes et cinq colonnes.

#Create un marché de dataframe qui a 4 lignes et 5 colonnes.
Marché = données.frame (Market_ID = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C
(«Inde», «USA», «Inde», «Australie»), Market_Type = C («Épicerie», «Bar», «Épicerie», «Restaurent»),
Market_SquareFeet = C (120,342,220,110))
#Display le marché DataFrame
Impression (marché)

Résultat:

Vous pouvez voir le cadre de données du marché dans l'image suivante:

Scénario 1: supprimer une seule ligne

Nous supprimons une seule ligne du cadre de données de ce scénario. En fonction du numéro de ligne ou de l'index de ligne, nous pouvons le supprimer. En r, l'indexation commence à partir de 1.

Ici, nous n'aurons pas séduit l'index de ligne via l'opérateur «-» (moins) que nous voulons supprimer.

Syntaxe:

dataFrame_Object [-row,]

Où,

«Row» fait référence à la position de ligne.

Voyons un exemple pour démontrer ce scénario.

Exemple

Dans cet exemple, nous supprimerons séparément les première et quatrième lignes et afficherons les lignes restantes dans un cadre de données de marché pour chaque scénario.

#Create un marché de dataframe qui a 4 lignes et 5 colonnes.
Marché = données.frame (Market_ID = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C
(«Inde», «USA», «Inde», «Australie»), Market_Type = C («Épicerie», «Bar», «Épicerie», «Restaurent»),
Market_SquareFeet = C (120,342,220,110))
#Remove 1ère ligne et afficher les lignes restantes dans un dataframe
Imprimer (marché [-1,])
#Remove 4th Row et afficher les lignes restantes dans un dataframe
Imprimer (marché [-4,])

Résultat:

Scénario 2: supprimer plusieurs lignes

Dans ce scénario, nous supprimons plusieurs lignes du cadre de données. En fonction des numéros de ligne ou des indices de ligne, nous pouvons les supprimer. En r, l'indexation commence à partir de 1.

Méthode 1: supprimer des lignes particulières

Ici, nous n'augmenterons pas les indices de ligne que nous voulons supprimer en les spécifiant dans un vecteur via l'opérateur «-» (moins).

Syntaxe:

dataframe_object [-c (row,…),]

Où,

«Row» fait référence à la position de ligne.

Voyons un exemple pour démontrer ce scénario.

Exemple

Nous supprimerons les deuxième, troisième et quatrième rangées du cadre de données du marché dans cet exemple.

#Create un marché de dataframe qui a 4 lignes et 5 colonnes.
Marché = données.frame (Market_ID = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C
(«Inde», «USA», «Inde», «Australie»), Market_Type = C («Épicerie», «Bar», «Épicerie», «Restaurent»),
Market_SquareFeet = C (120,342,220,110))
#Remove 2,3 et 4 rangées du marché DataFrame
Impression (marché [-c (2, 3, 4),])

Résultat:

On peut voir que la ligne 1 restante est retournée.

Méthode 2: Retirez les lignes dans la plage

Ici, nous n'aurons pas séduit les indices de ligne dans la gamme que nous voulons supprimer en spécifiant ces gammes dans un vecteur via l'opérateur «-» (moins).

Syntaxe:

dataframe_object [-c (premier: dernier),]

Où,

«First» fait référence à la première position de ligne, et «dernier» fait référence à la dernière position de ligne.

Voyons un exemple pour démontrer ce scénario.

Exemple

Dans cet exemple, nous retirerons les lignes de la deuxième position à la quatrième position.

#Create un marché de dataframe qui a 4 lignes et 5 colonnes.
Marché = données.frame (Market_ID = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C
(«Inde», «USA», «Inde», «Australie»), Market_Type = C («Épicerie», «Bar», «Épicerie», «Restaurent»),
Market_SquareFeet = C (120,342,220,110))
#Remove Rows de 2 à 4 index.
Imprimer (Market [-C (2: 4),])

Résultat:

On peut voir que la ligne 1 restante est retournée.

Méthode 3: Retirez les lignes jusqu'au dernier

Ici, nous n'aurons pas séduit les indices de ligne dans une gamme, via l'opérateur «-» (moins), nous voulons supprimer en spécifiant ces gammes dans un vecteur. nrow () renvoie le dernier index de ligne, afin que nous puissions supprimer les lignes en spécifiant cela comme la dernière position.

Syntaxe:

dataframe_object [-c (premier: nrow (dataframe_object)),]

Où,

«First» fait référence à la première position de ligne, et «nrow ()» fait référence à la dernière position de ligne.

Voyons un exemple pour démontrer ce scénario.

Exemple

Dans cet exemple, nous supprimerons les lignes de la deuxième position jusqu'à la fin du cadre de données.

#Create un marché de dataframe qui a 4 lignes et 5 colonnes.
Marché = données.frame (Market_ID = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C
(«Inde», «USA», «Inde», «Australie»), Market_Type = C («Épicerie», «Bar», «Épicerie», «Restaurent»),
Market_SquareFeet = C (120,342,220,110))
#Remove Rows de 2 à la fin de la ligne
Imprimer (marché [-c (2: nrow (marché)),])

Résultat:

On peut voir que la ligne 1 restante est retournée.

Approche 3: Retirez les lignes avec sous-ensemble ()

Méthode sous-ensemble () Dans la programmation R filtre les lignes en fonction de la condition. Si la condition est «fausse», alors ces lignes sont supprimées de la trame de données et revenez aux lignes restantes.

Syntaxe:

sous-ensemble (dataframe_object, condition)

Paramètres:

Il faut deux paramètres.

  1. DataFrame_Object est le cadre de données.
  2. La condition fait référence aux déclarations logiques ou expressives.

Exemple

Dans cet exemple, nous sélectionnerons les lignes où,

  1. Market_id supérieur à 2
  2. Market_place est l'Inde
  3. Market_SquareFeet - inférieur ou égal à 230
#Create un marché de dataframe qui a 4 lignes et 5 colonnes.
Marché = données.frame (Market_ID = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C
(«Inde», «USA», «Inde», «Australie»), Market_Type = C («Épicerie», «Bar», «Épicerie», «Restaurent»),
Market_SquareFeet = C (120,342,220,110))
#select des lignes où Market_id supérieur à 2
Imprimer ("lignes avec Market_id supérieures à 2:")
Imprimer (sous-ensemble (Market, Market_id> 2))
#Select Rows où Market_Place est l'Inde
Imprimer ("Rows with Market_place est l'Inde:")
Impression (sous-ensemble (Market, Market_Place == 'India'))
#Select Rows où Market_SquareFeet - inférieur ou égal à 230.
Imprimer ("Rows avec Market_SquareFeet inférieur ou égal à 230:")
Imprimer (sous-ensemble (Market, Market_SquareFeet<=230 ))

Résultat:

Conclusion

Dans cet article, nous avons appris qu'il pourrait être possible de supprimer une ligne unique ou multiple en spécifiant les positions de ligne. Si vous souhaitez supprimer conditionnellement les lignes, vous pouvez utiliser la méthode sous-ensemble () et spécifier la condition à l'intérieur.