Python csv sauter la ligne d'en-tête

Python csv sauter la ligne d'en-tête
Dans cet article, nous apprendrons comment nous pouvons supprimer l'en-tête des données du fichier CSV lors de la lecture du CSV lui-même parce que parfois nous n'avons pas besoin de l'en-tête des données du fichier CSV. Nous allons donc apprendre ces quatre méthodes, qui sont données ci-dessous:
  1. En utilisant la méthode suivante ()
  2. Utilisez la méthode diCtreader ()
  3. Skiprows de Pandas basés sur un numéro de ligne spécifique
  4. Skiprows de pandas basés sur une position d'index

Expliquons chacune des méthodes ci-dessus en détail.

Méthode 1: Utilisation de la méthode Next ()

Dans cette méthode, nous utiliserons la méthode suivante () et verrons comment cette méthode jettera la ligne d'en-tête avant d'imprimer toutes les autres données CSV.

Fichier csv: Le fichier CSV ci-dessous (test.csv) Nous utiliserons pour ce blog.

Mois, 1958 1959 1960
Janvier 340,360 417
318 342 391 février
Mars, 362 406 419
348 396 461 avril
Janvier 340,360 417
Février, 318 342 391 Importation CSV
avec ouvert ("Test.CSV "," R ") comme enregistrement:
# Nous créons un objet du lecteur CSV
csvReader_Object = CSV.lecteur (enregistrement)
# La ligne ignorera la première ligne du fichier CSV (ligne d'en-tête)
Suivant (CSVReader_Object)
# Nous imprimons maintenant toutes les lignes sauf la première rangée du CSV
pour la ligne dans csvReader_Object:
Imprimer (ligne)

Sortir:

[«Jan», «340», «360», «417»]
[«Février», «318», «342», «391»]
['Mar', '362', '406', '419']
['Avril', '348', '396', '461']
[«Jan», «340», «360», «417»]
[«Février», «318», «342», «391»]

Ligne 1: Nous importons le module CSV.

Ligne 3 -7: nous ouvrons le test.Fichier CSV en mode lecture ('r') comme enregistrement, puis nous créons un objet du CSV.Méthode Reader (). La méthode suivante (), lorsque nous l'appelons, rejette automatiquement la première ligne de l'objet CSV Reader et le reste des données que nous pouvons utiliser comme nous avons besoin.

Lignes 10-11: Maintenant, nous itèrent l'objet CSV Reader et imprimons chaque ligne. La sortie ci-dessus montre qu'il n'y a plus de ligne d'en-tête.

Méthode 2: Utilisation de la méthode dictreader ()

Maintenant, nous allons voir comment nous pouvons lire le CSV comme un format de dictionnaire. Mais après avoir lu le fichier CSV en tant que format direct, nous imprimerons uniquement la valeur, et non la clé, qui résoudra notre problème d'impression toutes les données sans la ligne d'en-tête. Nous utilisons le même test.Fichier CSV comme nous avons utilisé avant. Un exemple de cette méthode est donné ci-dessous:

Importer CSV
avec ouvert ("Test.CSV "," R ") comme enregistrement:
# Nous créons un objet du lecteur CSV
csvReader_Object = CSV.DiCtreader (enregistrement)
# La ligne ignorera la première ligne du fichier CSV (ligne d'en-tête)
# Parce que cela fonctionne comme un dict et que nous n'imprimons que des valeurs et non des clés
pour la ligne dans csvReader_Object:
Imprimer (ligne ["mois"], ligne ["1958"], ligne ["1959"], ligne ["1960"])

Sortir:

Jan 340 360 417
31 février 342 391
Mars 362 406 419
Avril 348 396 461
Jan 340 360 417
31 février 342 391

Ligne 1: Nous importons le module CSV.

Ligne 3 -5: nous ouvrons le test.Fichier CSV en mode lecture ('r') comme enregistrement, puis nous créons un objet du CSV.Méthode diCtreader ().

Lignes 8-9: Maintenant, nous itèrent l'objet CSV DiCtreader et imprimons chaque ligne. Mais cette ligne élimine automatiquement la première ligne à partir de l'objet CSV Reader car DiCtreader convertit chaque ligne dans un formulaire de dict (clé et valeur). Lorsque nous imprimons uniquement la valeur, pas la clé, qui montre uniquement les données, pas le k, v, qui était notre principal objectif.

Méthode 3: Utilisation d'attributs de skiprows de lecture pandas

Dans cette méthode, nous allons utiliser les skiprows d'attribut Pandas Read_CSV. Dans le skiprows, nous mentionnerons le numéro de ligne d'en-tête, qui est évidemment 1, nous définissons donc la valeur des skiprows comme 1 comme indiqué dans le programme ci-dessous. De cette façon, nous pouvons ignorer la ligne d'en-tête du CSV tout en lisant les données.

Importer des pandas en tant que PD
skipheaderdf = pd.read_csv ('test.csv ', skiprows = 1)
imprimer (skipheaderdf)

Sortir:

Jan 340 360 417
0 février 318 342 391
1 mars 362 406 419
2 avril 348 396 461
3 janvier 340 360 417
4 février 318 342 391

Ligne 1: Nous importons la bibliothèque Pandas en tant que PD.

Ligne 2: Nous lisons le fichier CSV à l'aide du module Pandas Read_CSV, et en cela, nous avons mentionné le skiprows = 1, ce qui signifie sauter la première ligne en lisant les données du fichier CSV.

Ligne 4: Maintenant, nous imprimons le résultat final Dataframe illustré dans la sortie ci-dessus sans la ligne d'en-tête.

Méthode 4: À l'aide de pandas, retirez l'en-tête du CSV à l'aide de la position d'index

Dans cette méthode, nous allons utiliser les skiprows d'attribut Pandas Read_CSV. Dans les skiprows, nous mentionnerons le numéro de position de l'indice d'en-tête, qui est évidemment 0, nous définissons donc la valeur des skiprows en carré-crochets ([0]) comme indiqué dans le programme ci-dessous. De cette façon, nous pouvons ignorer la ligne d'en-tête du CSV tout en lisant les données.

Importer des pandas en tant que PD
skipheaderdf = pd.read_csv ('test.csv ', skiprows = [0])
imprimer (skipheaderdf)

Sortir:

Jan 340 360 417
0 février 318 342 391
1 mars 362 406 419
2 avril 348 396 461
3 janvier 340 360 417
4 février 318 342 391

Ligne 1: Nous importons la bibliothèque Pandas en tant que PD.

Ligne 2: Nous lisons le fichier CSV à l'aide du module Pandas Read_CSV, et en cela, nous avons mentionné le skiprows = [0], ce qui signifie sauter la première ligne en lisant les données du fichier CSV.

Ligne 4: Maintenant, nous imprimons le résultat final Dataframe illustré dans la sortie ci-dessus sans la ligne d'en-tête.

Conclusion:

Cet article a vu quatre méthodes différentes pour sauter la ligne d'en-tête tout en lisant le fichier CSV. Toutes les méthodes de l'article ci-dessus sont parfaitement bien et sont utilisées par le programmeur Python pour sauter l'en-tête du fichier CSV lors de la lecture des données CSV. La méthode de la bibliothèque Pandas nous permet non seulement de supprimer l'en-tête des données du fichier CSV, mais peut également être utilisée pour supprimer d'autres lignes si nous spécifions leur numéro ou leur position d'index dans les skiprows. Ainsi, les skiprows pourront supprimer toutes ces lignes dont les chiffres leur seront affectés. Ainsi, le module Pandas pour sauter en-tête est le meilleur à utiliser, et il est également très pratique pour retirer les autres lignes.

Les autres méthodes utilisant le dictreader et le lecteur sont également disponibles, mais ce sont uniquement pour les lignes d'en-tête, donc si nous voulons supprimer d'autres lignes, nous devons également écrire un autre code.