Quel est le fichier CSV dans le langage de programmation R dans Ubuntu 20.04?
Le format de fichier CSV (Valeurs séparés par les virgules) est un moyen courant d'enregistrer les données tabulaires dans les feuilles de calcul et les bases de données. Un fichier CSV est un document texte brut qui contient des données tabulaires (entier et texte). La ligne respective du fichier se rapporte à un enregistrement de données. La virgule est utilisée comme séparateur de champ, qui donne à ce fichier format son nom. Dans le langage de programmation R, il existe un module inhérent appelé CSV qui vous permet de fonctionner avec des fichiers CSV. La fonction pour lire un fichier CSV dans le langage de programmation R a la syntaxe suivante.
Lire.csv ("file_name")La lecture.CSV () est une méthode d'emballage pour la lecture.table () qui utilise une virgule comme séparateur. La première ligne du fichier d'entrée comme en-tête pour les noms de colonne du tableau donné. Comme effet, c'est un choix énorme pour lire les fichiers CSV.
Comment lire le fichier CSV dans le langage de programmation R dans Ubuntu 20.04?
Dans de nombreux cas, la lecture des données d'un fichier CSV est essentielle lors de l'exécution de l'analyse en utilisant R. Quand il s'agit de lire les fichiers CSV, R est extrêmement fiable. Pour cela, nous avons besoin de données pour lire, écrire ou modifier les données en R. Ici, nous avons quelques illustrations sur la façon de créer un fichier CSV et de le lire. Nous avons également effectué les différentes opérations sur le fichier CSV qui lisent ces données spécifiques du fichier CSV dans la langue des scripts R.
Exemple 1: Création du fichier CSV dans R dans Ubuntu 20.04
Nous avons défini le cadre de données des dossiers des employés avec les détails de certains employés. Ensuite, sauvez ceci dans l'EMP.fichier csv.
Exemple 2: Lire à partir du fichier CSV dans R dans Ubuntu 20.04
La lecture.La fonction CSV () en R peut lire le texte intégral d'un fichier CSV comme cadre de données. Le fichier CSV à lire doit être dans le répertoire de travail, soit le répertoire doit être établi de manière appropriée dans R à l'aide de la fonction Setwd (). La lecture.La fonction CSV () peut également lire un fichier CSV via une URL.
Comme ci-dessus, nous avons défini la variable comme emp_data. L'EMP_DATA est affecté à la lecture.Fonction CSV où le nom du fichier est donné. Comme nous avons un fichier EMP.CSV présent dans notre répertoire actuel, R peut facilement interpréter ce fichier. Une fois, la commande d'impression est donnée dans l'invite R. Il affiche le contenu du fichier CSV sous forme tabulaire.
Exemple 3: Évalué le fichier CSV dans R dans Ubuntu 20.04
La lecture.La fonction CSV () produit une trame de données comme sortie par défaut. Voici une approche rapide pour vérifier ceci. La fréquence des colonnes et des lignes de trame de données de fichiers CSV peut également être vérifiée.
Dans la commande d'impression, nous avons appelé une fonction ncol pour les colonnes et nrow pour les lignes. Ces fonctions sont ensuite transmises avec la variable EMP_DATA à partir de l'exemple ci-dessus qui a un contenu de fichier CSV entier. La sortie a généré le nombre de colonnes et de lignes à l'intérieur de l'EMP.fichier csv. Dans la fonction, l'en-tête est d'abord défini sur true par défaut. En effet, le nombre de lignes n'inclut pas la tête; Ce CSV a cinq colonnes et huit rangées.
Exemple 4: Lisez la valeur min du fichier CSV dans R dans Ubuntu 20.04
Les données CSV peuvent être utilisées pour appliquer les fonctions d'agrégateur (.). Le signe $ est utilisé pour appliquer la fonction min () à la colonne.
Pour les données variables, nous avons d'abord lu le fichier CSV. Ensuite, nous avons une fonction min () appliquée à la colonne EMP_DATA. L'EMP_DATA a renvoyé le financement de la valeur minimale du fichier CSV. Là, nous avons une deuxième requête qui obtiendra la valeur maximale de la colonne spécifique du fichier CSV EMP_DATA.
Nous lisons la valeur maximale de l'EMP.Fichier CSV en utilisant la fonction maximale sur la colonne EMP_SALARY. Cette fonction générera le salaire maximum de l'EMP.table CSV.
Exemple 5: Lisez le fichier CSV et créez le fichier CSV sous-ensemble dans R dans Ubuntu 20.04
La fonction sous-ensemble () dans R peut être utilisée pour extraire le résultat correspondant des requêtes SQL sur le contenu CSV. Différentes requêtes peuvent être exécutées dans la fonction en même temps, chacune séparée par un opérateur logique. Dans R, le résultat est enregistré en tant que cadre de données.
De la lecture.Fonction CSV qui est stockée à l'intérieur des données variables, nous avons lu l'EMP.Informations CSV. La variable New_CSV est établie lorsque nous avons appelé la fonction de sous-ensemble et à la fonction de sous-ensemble, nous avons appliqué la condition. Le sous-ensemble produit de données est enregistré comme un cadre de données qui remplit les conditions énoncées dans les arguments de la fonction. Dans le cadre de données résultant, les numéros de ligne sont conservés.
Conclusion
Cet article explique comment lire à partir des fichiers CSV. Les fonctions en r, sont étendues. La lecture.La fonction CSV () en R nous fournit pour lire un fichier CSV qui se trouve actuellement dans notre répertoire de travail. La lecture.La fonction CSV () prend un nom de fichier comme argument et renvoie tous les enregistrements contenus. Avec les opérations CSV, nous avons vu comment créer et lire à partir des fichiers CSV dans R. Les requêtes SQL sont également appliquées au fichier CSV qui lisent les colonnes spécifiques sur des conditions satisfaisantes.