Python Lire CSV dans le tableau 2D

Python Lire CSV dans le tableau 2D
Comme nous le savons, lorsque nous parlons du tableau 2D, nous parlons du tableau Numpy. Le tableau Numpy est essentiellement utilisé par les informaticiens et les ingénieurs d'apprentissage automatique pour faire face aux énormes quantités de données stockées dans le fichier CSV. En conséquence, Numpy leur permet de traiter de grandes quantités de données dans un fichier CSV de manière très pratique. Python aide également de la même manière en fournissant différentes méthodes pour lire les données du fichier CSV dans un tableau Numpy. Donc, nous allons en apprendre davantage sur ces différents types de méthodes dans cet article.
  1. Utilisation de la méthode Numpy Loadtxt ()
  2. Utilisation de la méthode Numpy GenFromTxt ()
  3. Utilisation de Pandas DataFrame
  4. En utilisant la structure de données de la liste
  5. Utilisation de la méthode Pandas DataFrame Values ​​()

Qu'est-ce qu'un fichier CSV?

Un CSV est un fichier (valeurs séparés par virgule) dans lequel les données se présentent sous la forme d'un tabulaire. L'extension du fichier CSV est .CSV. Ce fichier CSV est principalement utilisé dans l'analyse des données. Outre l'analyse des données, le fichier CSV également utilisé dans l'application de commerce électronique car il est très facile à gérer dans tous les différents types de langages de programmation.

Méthode 1: Utilisation de la méthode Numpy Loadtxt ()

Dans cette méthode, nous allons utiliser le Numpy.Méthode LoadTxt () qui convertit les données CSV en un tableau 2D. Ci-dessous est un exemple de fichier CSV que nous utiliserons dans ce programme.

1,2
3,4
5,6
7,8
9,10

Code python:

Importer Numpy comme NP
CsvData = Open ("Samplecsv.CSV ")
Array2d_result = np.loadtxt (csvdata, délimiter = ",")
imprimer (array2d_result)

Sortir:

[[ 1. 2.]]
[3. 4.]]
[5. 6.]]
[ 7. 8.]]
[9. dix.]]

Ligne 1: Nous importons la bibliothèque Numpy.

Ligne 3-4: Nous ouvrons le fichier SamplecSV et nous passons à la fois CSVDATA et le délimiteur à NP.Fonction LoadTxt (), qui renvoie les données dans un tableau 2D.

Ligne 6: Nous imprimons enfin le résultat qui montre que maintenant nos données CSV se sont converties en un tableau 2D.

Méthode 2: Utilisation de la méthode Numpy GenFromtxt ()

Dans cette méthode, nous allons utiliser le Numpy.Méthode genFromtxt () qui convertit les données CSV en un tableau 2D. Ci-dessous est un exemple de fichier CSV que nous utiliserons dans ce programme.

1,2
3,4
5,6
7,8
9,10

Code python:

Importer Numpy comme NP
CsvData = Open ("Samplecsv.CSV ")
Array2d_result = np.GenFromTxt (CSVDATA, Delimiter = ",")
imprimer (array2d_result)

Sortir:

[[ 1. 2.]]
[3. 4.]]
[5. 6.]]
[ 7. 8.]]
[9. dix.]]

Ligne 1: Nous importons la bibliothèque Numpy.

Ligne 3-4: Nous ouvrons le fichier Samplecsv et nous passons à la fois CSVDATA et le délimiteur à Numpy NP.Fonction genfromtxt (), qui renvoie les données dans un tableau 2D.

Ligne 6: Nous imprimons enfin le résultat qui montre que maintenant nos données CSV se sont converties en un tableau 2D.

Méthode 3: Utilisation du Pandas DataFrame

Dans cette méthode, nous allons utiliser les pandas qui convertit les données CSV en un tableau 2D. Vous trouverez ci-dessous un exemple de fichier CSV que nous utiliserons dans ce programme.

1,2
3,4
5,6
7,8
9,10 Importer des pandas comme PD
df = pd.read_csv ('Samplecsv.csv ')
Imprimer (DF)
Array2d_result = df.to_numpy ()
imprimer (array2d_result)

Sortir:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Ligne 1: Nous importons la bibliothèque Pandas en tant que PD.

Ligne 2-3: Nous lisons le fichier CSV à l'aide de la méthode Pandas Read_CSV, puis imprimez le nouveau DataFrame (DF) sur l'écran comme indiqué dans la sortie ci-dessus.

Ligne 4-5: Nous utilisons ensuite la méthode DataFrame vers_Numpy qui convertit les valeurs entières de DataFrame en un tableau 2D comme indiqué dans la sortie.

Méthode 4: Utilisation de la structure de données de la liste

Dans cette méthode, nous allons utiliser la structure de données de la liste. La liste peut également nous aider à mettre les données CSV dans un tableau 2D. Le programme ci-dessous démontre la même méthode.

Importer CSV
Importer Numpy
avec ouvert ("Samplecsv.csv ", newline =") en tant que fichier:
result_list = list (csv.lecteur (fichier))
print (result_list)
result_2d = numpy.Array (result_list)
print (result_2d)

Sortir:

[['1', '2'], ['3', '4'], ['5', '6'], ['7', '8'], ['9', '10'] ]]
[['1' '2']
['3' '4']
['5' '6']
['7' '8']
['9' '10']]

Ligne 1: Nous importons les bibliothèques CSV et Numpy.

Lignes 3-5: Nous ouvrons le fichier SamplecSV, puis lisons les données de chaque fichier CSV à l'aide du CSV.Méthode Reader () et convertir les résultats en une liste de listes.

Ligne 6: Maintenant, nous utilisons le Numpy.Méthode du tableau pour convertir toute la liste des listes en un tableau 2D. Le résultat dans la sortie montre que nos données CSV ont maintenant été converties avec succès en un tableau 2D.

Méthode 5: Utilisation des valeurs de Pandas Dataframe

Dans cette méthode, nous allons utiliser la méthode très basique pour convertir les données CSV en un tableau Numpy en utilisant la fonction DataFrame Values ​​(). Le programme ci-dessous démontrera la même.

Importer des pandas en tant que PD
df = pd.read_csv ('Samplecsv.csv ')
Imprimer (DF)
Array2d_result = df.valeurs
imprimer (array2d_result)

Sortir:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Ligne 1: Nous importons la bibliothèque Pandas en tant que PD.

Ligne 2-4: Nous lisons le fichier CSV à l'aide de la méthode Pandas Read_CSV, puis imprimez le nouveau DataFrame (DF) sur l'écran comme indiqué dans la sortie ci-dessus.

Ligne 5-6: Nous utilisons ensuite la fonction DataFrame Values ​​() qui convertit le dataframe en un tableau 2D Numpy comme indiqué dans la sortie.

Conclusion

Dans cet article, nous avons vu différentes méthodes pour lire les données CSV dans un tableau 2D. Nous avons montré toutes les méthodes actuellement utilisées par différents programmeurs et informaticiens. Certaines des méthodes sont intégrées et certaines des méthodes sont créées en peignant différentes méthodes de différentes bibliothèques. Mais toutes les méthodes ci-dessus que vous pouvez utiliser en fonction de vos exigences. Si vous savez lire le fichier CSV, vous pouvez également créer certaines de vos propres méthodes.