Pandas lis TSV

Pandas lis TSV

Dans «Pandas», nous pouvons facilement lire des fichiers comme nous pouvons lire les fichiers CSV, nous pouvons lire les fichiers TSV, nous pouvons lire des fichiers texte et nous pouvons également lire SQL. Nous expliquons le fichier TSV ici. Il s'agit d'un fichier de format de texte dans lequel les données tabulaires sont stockées dans le format de texte. Nous pouvons facilement créer ou lire le fichier «valeur séparée par onglet» dans «Pandas» car les «pandas» contient une fonction intégrée qui aide à créer et à lire les fichiers TSV. Nous discuterons dans ce tutoriel les méthodes que «Pandas» nous fournit pour lire le fichier TSV. Nous allons créer et lire le fichier TSV et convertir également ses données après avoir lu le fichier TSV dans le DataFrame.

Méthodes pour lire le fichier TSV dans «Pandas»

Nous pouvons lire le fichier TSV en utilisant deux méthodes de «pandas» et nous utiliserons ces deux méthodes dans ce tutoriel. Les méthodes sont données ci-dessous:

  • Méthode read_table ().
  • Méthode read_csv ().

Exemple # 01: Utilisation de la méthode "read_table ()"

Nous utilisons l'outil «Spyder» pour aider à générer les codes «Pandas». Avant de décrire le concept de lecture du fichier TSV, nous avons expliqué comment nous pouvons créer le fichier TSV dans "Pandas". Nous importons la bibliothèque «Pandas», puis créons une dataframe «new_df» dans laquelle nous avons entré certaines colonnes. Les données sont également entrées dans chaque colonne. Nous avons entré "New_name, New_1, New_2, New_3, New_4 et New_5" qui sont les colonnes du "new_df" DataFrame.

Ensuite, nous avons ajouté la méthode «TO_CSV ()» dans laquelle nous ajoutons le nom du fichier. Nous insérons «newfile.TSV "qui convertira le dataframe que nous avons créé dans ce code en fichier TSV et nommez ce fichier" newfile.TSV ". Nous avons également ajusté le paramètre «SEP» où nous avons ajouté «\ t» comme valeur. Maintenant, le «newfile.TSV "est créé. Nous allons également montrer ce fichier TSV.

Nous appuyons sur «Shift + Enter» qui exécute les codes et le «newfile.TSV "est ensuite généré. Ce fichier TSV est illustré ci-dessous. Ici, les données du DataFrame sont stockées sous forme de texte. Maintenant, nous allons également lire ce fichier TSV.

Nous avons à nouveau importé les «pandas» dans le nouveau fichier. Nous allons lire le fichier TSV que nous avons créé ci-dessus. Nous placons «my_dataframe» qui stocke les données du fichier TSV après l'avoir lu. Nous utilisons le «PD.read_table () "Méthode et passer le nom du fichier que nous devons lire qui est" newfile.TSV ". Cette méthode lira les données qui sont présentes dans le fichier TSV et génèrent le dataframe des données du fichier TSV, puis les enregistrez dans "MY_DATAFRAME". Après cela, le «my_dataframe» est entré dans le «print ()». Donc, il sera imprimé sur le terminal lors de l'exécution.

Lorsque nous exécutons ce code «pandas», les données du fichier TSV sont affichées comme le dataframe sur le terminal. Les données du fichier TSV sont affichées ci-dessous après que nous obtenons après avoir lu le fichier TSV.

Exemple # 02: Utilisation de la méthode "read_csv ()"

Nous pouvons également lire le fichier TSV en utilisant la méthode "read_csv ()". Ici, nous utilisons la méthode «read_csv ()» pour lire le «newfile.TSV ". Nous initialisons la variable «données» avec la méthode «read_csv ()» et nous avons également ajouté deux paramètres. Tout d'abord, nous avons ajouté le nom du fichier, puis nous définissons le paramètre «SEP». Sa valeur est ajustée comme «\ t». Nous imprimons également «données» à l'aide de «print ()» ici.

Il montre également les données du fichier TSV au format DataFrame ou nous pouvons dire que sous forme tabulaire. Les deux méthodes fonctionnent de la même manière et renvoient le même résultat.

Exemple # 03:

Le nouveau fichier TSV est rendu ci-dessous. Maintenant, nous devons lire les données de ce fichier TSV en utilisant la méthode «Pandas».

Nous avons ajouté la méthode "read_table ()" pour lire le fichier TSV mais nous avons ajouté un paramètre de plus cette fois. Après avoir ajouté le nom du fichier TSV qui est «l'éducation.TSV ", nous avons également ajouté le paramètre" index_col "qui aide à ajuster la colonne d'index du dataframe qui est créé après avoir lu le fichier TSV. Nous ajustez la colonne «RandomName» comme index du dataframe. Ainsi, lorsque le code est exécuté, le fichier sera lu, alors le dataframe que nous obtenons aura le «RandomName» comme colonne d'index. Nous affichons également les données du fichier TSV après avoir lu ici en utilisant "print ()".

Ici, vous voyez que les données ci-dessus du fichier TSV s'affichent sous forme tabulaire. Nous obtenons ce DataFrame en lisant le fichier TSV à l'aide de la méthode "read_table ()". Notez également que la colonne «RandomName» est définie ici comme la colonne d'index.

Exemple # 04:

Maintenant, nous avons un autre fichier TSV qui est illustré ci-dessous. Le fichier contient les données au format texte. Nous lirons également ce fichier.

Nous avons créé la variable «new_columns». Nous ajoutons quelques noms parce que nous voulons ajuster ces noms comme les noms de colonne du DataFrame que nous obtenons après avoir lu le fichier TSV qui est affiché ci-dessus. Les noms que nous avons ajoutés sont «class_mammals, class_fish, class_repatiles, class_amphibians et class_birds». Après cela, nous avons utilisé la méthode «read_table» dans laquelle nous avons ajouté trois paramètres. Tout d'abord, nous avons inséré «Animals_data.TSV "qui est le nom du fichier TSV, puis ajusté" Aucun "au paramètre" En-tête ". Nous avons également ajouté le «New_Columns» que nous avons initialisé dans ce code au paramètre «Noms». Ainsi, les noms que nous avons ajoutés ci-dessus sont ajustés comme les noms de colonne du dataframe. Ensuite, nous rendons les données à l'aide du «print ()».

Les données affichées dans le format texte dans le fichier TSV ci-dessus sont converties en dataframe. Les nouveaux noms de colonne que nous avons ajoutés dans le code sont rendus et les noms de colonne précédents sont transformés en ligne ou valeurs de ces colonnes.

Exemple # 05:

Nous lisons le même fichier que nous avons montré dans l'exemple 4, mais cette fois, nous sautons quelques lignes après avoir lu les «Animals_data.Fichier TSV ". Nous venons d'ajouter le quatrième paramètre à la méthode "read_table ()" qui est le paramètre "Skiprows". Réglez-le sur «4» parce que nous voulons ignorer les quatre premières rangées du Dataframe générées après avoir lu le «Animals_data.TSV ".

Le DataFrame est à nouveau rendu, mais les quatre premières lignes ne sont pas présentes dans ce DataFrame car nous avons ignoré les «4» lignes de DataFrame.

Exemple # 06:

Nous lisons à nouveau le «Animals_data.Fichier TSV "mais avec la méthode" read_csv () ". Nous sommes entrés dans les «animaux_data.TSV "puis définissez le" Sep "sur" \ t ". De plus, nous avons ajusté la valeur «Aucun» pour «l'en-tête» et les noms que nous ajoutons ici seront définis comme les noms de colonne. Nous n'avons pas sauté une seule ligne en utilisant le paramètre "Skiprows".

Le dataframe que nous obtenons est affiché et les noms de colonne sont ajustés en conséquence, car nous avons entré dans le code. De plus, la première ligne est supprimée de DataFrame ici.

Exemple # 07:

Un autre fichier TSV est affiché. Maintenant, nous allons montrer comment obtenir la colonne sélectionnée après avoir lu le fichier TSV.

Nous avons appliqué la méthode «read_table ()» et ajouté un nouveau paramètre qui est les paramètres «UseCols» et ajouté le nom de la colonne que nous voulons obtenir des «voitures.Fichier TSV ". Nous avons ajouté «prix» qui est le nom de la colonne. Maintenant, il n'accédera qu'aux données de la colonne «Prix» et les économisera dans «CARSDF». Ensuite, nous rendons les données de la colonne «Prix» ici.

Une seule colonne est affichée car nous avons ajusté le paramètre "UseCols" dans la méthode "read_table ()". Donc, cela n'a pas montré toutes les données du fichier TSV ici.

Conclusion

Nous pouvons lire différents fichiers dans «Pandas» à l'aide de la méthode «Pandas». Nous avons donc écrit ce tutoriel dans lequel nous avons expliqué comment lire le fichier TSV dans "Pandas". Nous avons d'abord expliqué la création du fichier TSV, puis nous avons discuté de deux méthodes de ce tutoriel qui aident à lire les données du fichier TSV. Nous avons expliqué la méthode "read_table ()" ainsi que la méthode "read_csv ()" et avons expliqué comment ces méthodes aident à lire le fichier TSV dans "Pandas". Nous avons utilisé ces méthodes dans ce tutoriel en ajoutant différents paramètres à chaque fois dans chaque code pour obtenir des résultats différents.