Retirez les colonnes dans R

Retirez les colonnes dans R
«Un cadre de données contiendra fréquemment des colonnes qui ne sont pas pertinentes pour votre enquête. Pour faciliter l'accent sur les colonnes restantes, ces colonnes doivent être supprimées de l'ensemble de données. En fournissant des noms d'étiquette et des axes associés ou en définissant directement les noms d'index ou de colonnes, les colonnes peuvent être éliminées. Les étiquettes sur plusieurs étapes peuvent être supprimées à l'aide d'un index multi-index en désignant le niveau.

Dans R, vous devrez parfois éliminer une ou plusieurs colonnes spécifiées à partir d'un cadre de données. Heureusement, il existe une méthode intégrée du module R qui rend cette simple. La suppression des colonnes d'un ensemble de données est simplement une méthode pour supprimer les colonnes inutiles de la trame de données. Dans cet article, nous examinerons diverses méthodes distinctes pour éliminer les colonnes par titre d'un ensemble de données dans R."

Comment supprimer les colonnes des trames de données dans le R dans Ubuntu 20.04?

Le mécanisme de chute de colonne dans R vous permet de supprimer les colonnes inutiles d'un cadre de données. Dans R, vous pouvez laisser tomber une colonne par son nom de diverses manières. Cet article montre comment supprimer une colonne d'un cadre de données à travers différents cas dans de nombreuses méthodes différentes.

Exemple # 1: Utilisation de la méthode du sous-ensemble pour supprimer les colonnes dans R dans Ubuntu 20.04

L'utilisation de la méthode sous-ensemble () avec le symbole «-», qui signifie abandonner les variables, est l'un des moyens les plus simples de déposer des colonnes. Cette fonction dans le langage de programmation R est utilisée pour créer des sous-ensembles d'une trame de données et pour supprimer les colonnes d'un cadre de données. La syntaxe du sous-ensemble en R est comme ceci: sous-ensemble (df, expr). Où df est la trame de données, et l'expr est indiqué comme l'expression du sous-ensemble.

Dans l'exemple de script, nous avons créé le cadre de données «Data1» qui contient quatre colonnes x1, x2, x3 et x4. L'enregistrement est inséré à l'intérieur de ces colonnes. Lors de l'exécution de la commande data1, la trame de données est imprimée, affichant les noms de colonne avec les entrées dont ils ont. Après cela, nous avons créé une variable Data2 et appelé la méthode de sous-ensemble à l'intérieur. La méthode de sous-ensemble prend les données1 comme entrée et la condition de sélection pour supprimer les colonnes x1 et x3.

Lorsque le DATA2 est exécuté, il génère la nouvelle trame de données, qui a toutes les colonnes sauf les X1 et X3, car ces colonnes sont supprimées avec la méthode de sous-ensemble.

Exemple # 2: Utilisation de la méthode du nom pour supprimer les colonnes dans R dans Ubuntu 20.04

Cette technique crée un vecteur de caractères de goutte dans lequel les noms de colonne sont stockés. Plus tard, nous demandons à R de choisir toutes les variables sauf celles indiquées dans la chute de colonne. La négation est indiquée par le «!" symbole. La méthode names () en R est utilisée pour récupérer ou modifier le nom de l'objet. Cette méthode accepte l'objet comme un paramètre, qui peut être une matrice, un vecteur ou un cadre de données, ainsi que la valeur qui sera utilisée pour nommer l'objet. La longueur du vecteur de valeur fourni doit correspondre exactement à la longueur de l'objet à nommer, et il renvoie tous les noms de colonnes.

Dans le script R ci-dessus, nous avons établi le cadre de données à l'intérieur de la variable «DF."Le cadre de données est imprimé à l'écran, et comme vous pouvez le voir, ce cadre de données a quatre champs avec des entrées distinctes. Ensuite, nous avons inclus la commande Drop et spécifié les noms de colonne à l'intérieur du vecteur. La nouvelle variable est créée comme «new_df», où la méthode du nom est invoquée, et à la méthode Name (), nous avons passé notre trame de données «DF."Notez que nous avons utilisé l'opérateur% en% après la méthode du nom et la commande de dépôt à droite de l'opérateur% en%.

L'exécution du code ci-dessus génère le cadre de données suivant où les colonnes Y2 et Y3 ont été supprimées.

Exemple # 3: Utilisation de la méthode Sélectionner pour supprimer les colonnes dans R dans Ubuntu 20.04

Nous utiliserons Select () dans cette méthode en important le package DPLYR dans R et en spécifiant l'argument pour omettre les colonnes de l'ensemble de données. Essentiellement, cette fonction enregistre simplement les variables que vous spécifiez.

Nous avons inclus le package DPLYR pour accéder à la méthode de sélection. De plus, nous avons construit le cadre de données à partir duquel nous pouvons supprimer les colonnes. La trame de données est générée dans la forme tabulaire lors de l'exécution de la commande MyData lorsque la trame de données est stockée à l'intérieur de cette variable. Après cela, dans l'image invite suivante, nous avons déployé la méthode de sélection où le cadre de données est spécifié comme argument, et le nom de colonne A1 avec le signe moins est fourni.

L'invite R interprète cette commande de méthode sélectionnée et publie le cadre de données, qui a supprimé la colonne A1.

Exemple n ° 4: Utilisation de la méthode de sélection pour supprimer les colonnes par les positions de colonne dans R dans Ubuntu 20.04

Nous passerons la position de l'index de colonne en tant que vecteur à la méthode de sélection avec un signe négatif pour supprimer la position colonne par colonne, comme vu ci-dessous.

Ici, nous avons d'abord inclus le module DPLYR. Et puis, nous avons inséré le cadre de données intégré «Iris."Le cadre de données de l'iris s'affiche, et il a plusieurs colonnes, comme indiqué dans l'invite R. Nous pouvons supprimer l'une des colonnes à l'intérieur du cadre de données de l'iris en spécifiant l'index de la colonne. Pour cela, nous avons la méthode Select () sur laquelle nous avons passé la trame de données et la valeur d'index au vecteur. Les colonnes 3,4 et 5 sont supprimées de l'iris du cadre de données, qui s'affiche ci-dessous.

Exemple n ° 5: Utilisation de la méthode Sélectionner pour supprimer les colonnes par le caractère de démarrage et de fin de la colonne dans R dans Ubuntu 20.04

Nous pouvons également choisir des colonnes en fonction de leurs personnages de début et de fin ici. La fonction starte_with () renvoie la colonne qui commence par le caractère fourni. Pour utiliser la méthode start_with (), nous devons suivre la syntaxe fournie par le langage R, qui est sélectionné (dataFrame, -starts_with («substring»)). Où DataFrame désigne la source, DataFrame et la sous-chaîne désignent le caractère ou la chaîne qui les précède.

Nous avons sélectionné la croissance des dents du cadre de données dans cet exemple car il a trois colonnes imprimées à l'écran. Maintenant, à l'étape suivante, nous avons une méthode start_with () à l'intérieur de la commande SELECT. La méthode start_with () avec un signe moins prend le nom de la colonne qui commence par la «dose» dans le cadre de données de la croissance de dents. Il a supprimé la colonne «dose» de la trame de données lorsque cette commande de sélection a été exécutée.

Le endorth () est une fonction qui renvoie la colonne qui contient le caractère donné à la fin. La syntaxe que nous utilisons pour la méthode end_with () est la suivante: select (dataframe, -ends_with ("substring")). Où DataFrame fait référence à l'entrée DataFrame, et la sous-chaîne fait référence au caractère ou à la chaîne qui les suit.

Comme la méthode de start_with () ci-dessus, nous avons passé la colonne «Supp» de la croissance de la dents du trame de données à la méthode Ends_with () avec le signe moins. Cette méthode a également supprimé la colonne qui se termine_ avec le «Supp."

Conclusion

Le langage de programmation R a été utilisé pour démontrer l'approche de la suppression des colonnes d'un cadre de données. Nous avons vu le sous-ensemble et la méthode de nom intégrés du R, qui a supprimé les colonnes. Dans R, vous pouvez supprimer une colonne en utilisant l'opérateur moins avant la méthode de sélection. De plus, la méthode Select () dans le module DPLYR en R est utilisée pour choisir ou supprimer les colonnes en fonction des conditions comme commencent avec, se termine par et des colonnes de décharge en fonction de l'emplacement est présenté avec des exemples.