Combiner les colonnes en r

Combiner les colonnes en r
«Il existe une diversité de scénarios où les ensembles de données sont divisés en de nombreuses tables et diverses raisons pour lesquelles cela peut être le cas. Il est parfois plus simple de recueillir des informations dans des morceaux plus petits, tandis que dans certaines situations, il est préférable de minimiser la taille du fichier. Indépendamment de la raison pour laquelle les ensembles de données sont fragmentés dans des tables distinctes, elles doivent être structurées d'une manière qu'il devrait y avoir un minimum d'une colonne similaire entre les deux tables, ce qui leur permet de combiner si nécessaire.Il existe trois stratégies majeures que nous examinerons pour réduire votre charge de travail et nous assurer que chaque colonne et paramètre importants de vos différents ensembles de données est intégré de manière appropriée.Après avoir parcouru toutes les techniques et leurs codes d'exemples pratiques correspondants, vous pourrez faire une forte emprise sur le concept de combinaison de colonnes dans R."

Combinant des colonnes en r

R nous fournit plusieurs façons de combiner les colonnes d'un dataframe. Dans cet article, nous vous familiariserons avec 3 d'entre eux; en utilisant la fonction «col ()», en utilisant la fonction «unite ()», et en utilisant la fonction «str_c ()».

Combinez des colonnes par la fonction «col ()»

L'une des méthodes pour combiner les colonnes d'une dataframe dans R est d'utiliser la fonction «col ()». Cette fonction fonctionne en combinant des colonnes à partir de deux données de données différentes ainsi que dans le même dataframe.

Avant de nous concentrer sur sa mise en œuvre, nous devons d'abord comprendre la syntaxe de la fonction «Paste ()».

# Pâte (données $ c1, données $ c2, septor

La syntaxe de la fonction «Paste ()» a 3 paramètres. «Données» est le nom de la dataframe que vous entreriez, et «C1» est le nom de colonne de ce dataframe. «C2» fait référence à un autre nom de colonne dans le dataframe que vous devez combiner avec le premier. Tandis que «SEP» signifie un séparateur qui sépare deux colonnes et («») fait référence à tout ce qu'un séparateur doit ajouter entre les 2 colonnes. Ici, il est utilisé pour ajouter de l'espace entre les deux colonnes tout en les rejoignant.

Nous avons créé un DataFrame avec 3 colonnes; «Firstname», «LastName» et «Age."En utilisant la fonction" C () ", attribuez des valeurs à toutes les colonnes. Le «FirstName» et «LastName» ont des valeurs de type de données de caractère, tandis que la colonne «Age» a stocké des valeurs de type de données numériques. Nous avons créé une dataframe nommée «Info» et stocké les valeurs des «données.frame () ”Fonction dedans. L'instruction «print ()» affichera le dataframe que nous venons de créer.

Dans l'écran de sortie, vous pouvez voir une table avec 3 colonnes.

Nous allons maintenant utiliser la fonction «col ()». Tout d'abord, écrivez le nom de DataFrame où vous avez stocké des valeurs; Comme nous l'avons nommé «Info», ajoutez ensuite un opérateur «$» à côté, que nous utilisons pour choisir une colonne ou pour allouer une nouvelle valeur à une colonne. Procéder plus loin en créant une nouvelle colonne avec le nom «FullName», à laquelle nous attribuerons les valeurs combinées des 2 colonnes différentes. À l'intérieur de la fonction «Paste ()», mentionnez le nom du DataFrame avec un opérateur «$» et la colonne que vous souhaitez sélectionner. Après avoir mis une virgule, écrivez le nom de DataFrame, l'opérateur «$» et la deuxième colonne que vous souhaitez fusionner. "(Sep =" ")" ajoutera de l'espace entre les deux colonnes tout en les combinant.

L'image ci-dessous montre les deux tables; le premier avec le dataframe initial et l'autre avec une colonne combinée «Fullname."

Vous pouvez supprimer le DataFrame précédent en éliminant la première instruction «print ()».

La sortie peut être trouvée dans l'image ci-dessous.

Combiner les colonnes par fonction «unite ()»

Une autre méthode pour rejoindre les colonnes dans la programmation R consiste à utiliser la fonction «unite ()». Nous devons charger le package qui contient cette fonction qui est le package «Tidyr».

Pour utiliser la fonction «unite ()», la syntaxe que nous suivrons est:

# Unite (Nom de DataFrame, nom de colonne combinée, C (Column1, Column2))

Où le «nom de dataframe» est le dataframe que vous entrerez. «Nom de la colonne combinée» est le nom de la colonne où vous souhaitez stocker les données fusionnées. Et à l'intérieur de la fonction «c ()» se trouvent «colonne1» et «colonne2», les colonnes dont vous avez besoin pour combiner.

Dans l'exemple en main, nous avons d'abord installé le package «Tidyr» de la bibliothèque R. Créé un DataFrame de la même manière que nous l'avons créé dans l'exemple ci-dessus. Nous voulons combiner 2 colonnes; "prénom et nom."À l'intérieur de la fonction" Unite () ", nous écrivons le nom de DataFrame, qui est" Info.”Ensuite, le nom de la colonne où les valeurs de colonne combinées seront stockées comme« FullName."Utilisation de la fonction" C () "pour appeler les 2 colonnes à combiner. Enfin, l'instruction «print ()» affichera la sortie.

Une nouvelle colonne avec le nom «FullName» stockant des valeurs de fusion des colonnes «FirstName» et «LastName».

Combinaison des colonnes par la fonction "str_c ()"

Maintenant, nous rejoignons plusieurs colonnes avec la méthode str_c (). Pour cela, initialement, nous devons installer le package «Stringr."

La fonction "str_c ()" fonctionne avec cette syntaxe:
Str_c (dataframe $ chronn1, “”, dataframe $ column2)

«DataFrame» est le dataframe que nous avons créé. «Column1» et «Column2» sont les 2 colonnes que nous voulons concaténer. Si vous avez remarqué, il y a de l'espace («») entre les noms de colonne. Si nous n'ajoutons pas cet espace supplémentaire, cela fusionnera les deux colonnes sans espace.

Voici un exemple de ce que nous avons fait.

Au tout début, nous avons chargé un package «stringr» qui nous permettra d'utiliser la fonction «str_c ()». Nous avons utilisé le dataframe créé dans les exemples ci-dessus et, avec les mêmes étapes que celles mentionnées, stocké ses valeurs dans un nouveau dataframe nommé «Info."

À l'intérieur de la fonction «str_c ()», nous avons pris les noms des deux colonnes comme «info $ firstname» et «info $ lastname» et ajouté de l'espace entre eux afin qu'ils ne se mêlent pas lorsqu'ils ne se mêlent pas lorsqu'ils sont concaténés.

Vous pouvez voir la colonne combinée résultante de l'exemple démontré ci-dessus.

Conclusion

La combinaison de colonnes dans la programmation R est un concept super facile et utile. Cela peut être fait par plusieurs techniques en utilisant Rstudio dans Ubuntu 20.04. Nous avons fait un effort pour vous présenter les méthodes et techniques qui peuvent être utilisées pour la concaténation des colonnes dans R. En démontrant des exemples de codes et en élaborant chaque petit détail à ce sujet, notre objectif et notre objectif intentionnels est de vous guider le plus simplement et de manière fiable pour apprendre et profiter de la combinaison des colonnes dans la programmation R.