Xlsx à csv en python

Xlsx à csv en python
Ces dernières années, Python a augmenté comme l'un des langages de programmation dominants. La communauté Python s'est considérablement élargie à la suite de la popularité et de l'utilité de Python. Nous allons entrer dans les détails dans cet article sur la façon d'utiliser Python pour convertir XLSX en CSV. Nous sommes conscients que les fichiers Excel sont fréquemment utilisés pour effectuer une analyse financière, organiser les données, la saisie des données, la comptabilité, la gestion des données, la création de graphiques et de graphiques, etc. Cependant, nous préférons surtout utiliser des fichiers CSV pour l'importation de données et l'exportation. C'est une approche consiste à transférer les données structurées à l'aide d'un fichier texte brut.

Qu'est-ce qu'un fichier XSLX?

Lors de la fabrication de feuilles de calcul dans les dernières versions d'Excel, Microsoft utilise un fichier XLSX comme type de fichier par défaut. Semblable au type de fichier DOCX de Word, nous pouvons ouvrir les fichiers XLSX à l'aide d'une variété d'applications / programmes.

Qu'est-ce qu'un fichier CSV?

Le format de fichier CSV est ce que nous pouvons utiliser pour stocker les valeurs de données tabulaires dans les feuilles de calcul et les bases de données. Les données tabulaires, texte ou texte, sont stockées en texte brut dans un fichier CSV. Un enregistrement dans le fichier CSV est la valeur de données stockée sur chaque ligne du fichier. Chaque enregistrement peut avoir plus d'un champ séparé par des virgules.

Différences clés entre les fichiers XLSX et CSV

Les utilisateurs utilisent souvent CSV et XLSX de manière interchangeable, et ils ne sont généralement pas au courant des distinctions entre eux, quelles sont leurs caractéristiques fondamentales et comment ils fonctionnent. Il ne sert que de source d'informations pour l'utilisateur. Presque toutes les entreprises et les entreprises utilisent les deux pour aider les utilisateurs à gérer, à mettre à jour et à stocker les données de l'utilisateur. Voici quelques différences clés entre les fichiers XLSX et CSV que vous devez connaître:

  • Le format CSV enregistre les données tabulaires dans un fichier texte de délimiteur avec le .Extension CSV. Alors que le fichier Excel ou XLSX est une feuille de calcul qui stocke les fichiers dans son format propriétaire, à savoir. xls ou xlsx.
  • Les fichiers Excel sont des fichiers binaires qui contiennent les données de chaque feuille de travail dans un classeur. Tandis que le CSV est un format de texte simple et simple avec une séquence de valeurs de données séparées par des virgules.
  • Les opérations de données ne peuvent pas être effectuées sur des fichiers CSV. Cependant, ils peuvent être effectués sur des fichiers Excel.
  • Les fichiers CSV sont plus rapides et utilisent moins de mémoire que les fichiers xlsx. Cependant, Excel utilise plus de mémoire lors de l'importation des données.
  • Si nous comparons CSV avec Excel, nous pouvons ouvrir les fichiers CSV dans n'importe quel éditeur de texte Windows tandis que les fichiers Excel ne peuvent pas.

Comment convertir un fichier XLSX en CSV à l'aide de Python?

Un fichier XLSX peut être transformé en un fichier CSV dans Python en utilisant une variété de méthodes. Python comprend une variété de modules et de fonctions qui peuvent nous aider à accomplir cette tâche. Ici, nous allons passer par quelques méthodes qui peuvent être utilisées pour convertir les fichiers XLSX en fichiers CSV dans Python.

Prérequis pour effectuer la conversion Excel to CSV

L'installation des exigences est la première étape. Nous utilisons les modules comme combiner les pandas, le CSV et l'OpenPyxl, etc. Dans ce tutoriel. Le package Pandas de Python permet la manipulation et l'analyse des données. Pandas est une bibliothèque bien connue parmi les programmeurs Python. Les fichiers Excel peuvent être lus et écrits à l'aide du package Python appelé OpenPyxl. Nous ne traiterons pas directement avec cette bibliothèque. Pandas utilise plutôt OpenPyxl en interne.

À l'aide du référentiel PYPI, nous pouvons installer les deux packages:

Méthode 1: Convertir XLSX en CSV à l'aide du module Pandas

Exemple 1: Convertir un fichier XLSX en CSV

Pandas est un module open source créé pour le langage de programmation Python pour manipuler et analyser les données. Pour travailler avec des séries chronologiques et des tables numériques, Pandas offre une variété de fonctionnalités et de fonctionnalités. À l'aide de pandas, des ensembles de données petits et énormes peuvent être lus, filtrés et réorganisés. Et les résultats peuvent être produits dans une variété de formats tels que Excel, JSON et CSV. Nous utilisons la méthode read_excel () de pandas pour lire un fichier Excel, et la méthode to_csv () pour transformer le DataFrame en un fichier CSV.

Nous imprimons notre .Fichier CSV en tant que dataframe comme on peut le voir dans la sortie. Le script précédent convertit notre fichier XLSX en CSV et crée un «salaire.Fichier CSV »dans le répertoire actuel.

Exemple 2: Convertir le fichier XLSX (avec plusieurs feuilles) en CSV

Dans l'exemple qui suit, nous lisons d'abord les noms de feuille du fichier Excel. Les noms des feuilles individuelles sont ensuite bouclés et enregistrés en tant que fichiers CSV distincts. Le script enregistre les CSV au même endroit.

Nous utilisons un exemple de fichier XLSX ayant deux ou plusieurs feuilles de calcul ou feuilles de calcul.

Comme on peut le voir, notre fichier XLSX se compose de deux feuilles (feuille1 et feuille2). Maintenant, nous écrivons un code pour convertir ce fichier xlsx en CSV.

Sortir:

Le script a converti avec succès le fichier XLSX avec deux feuilles en un seul fichier CSV avec une seule feuille.

Exemple 3: Convertir plusieurs fichiers XLSX en fichiers CSV séparés

Considérez un scénario dans lequel vous avez besoin pour convertir plusieurs fichiers Excel dans votre répertoire de travail en CSV. Vous pouvez utiliser cette méthode. Nous commençons par supposer que chaque fichier ne contient qu'une seule feuille. Ensuite, nous étendons notre méthode pour gérer plusieurs fichiers et plusieurs feuilles. Le code Python qui suit utilise le module standard global. Nous correspondons aux chemins de fichier en utilisant des modèles avec glob. Il correspond à tous les fichiers avec le .Extension xlsx dans le répertoire de travail. Après cela, nous développons une fonction qui lit les fichiers Excel et les enregistre sous forme de fichiers CSV. Nous appelons cette fonction sur chaque chemin de fichier trouvé.

Ce script précédent convertit tous les fichiers XLSX dans le répertoire actuel en fichiers CSV.

Maintenant, nous convertissons les fichiers XLSX avec plusieurs feuilles de calcul en CSV. C'est probablement la partie difficile. Trois fichiers Excel sont dans notre répertoire de travail. De plus, certains d'entre eux se composent de plus d'une feuille. Nous visons à:

  1. Créer un répertoire pour chaque fichier de feuille de calcul,
  2. Convertir les feuilles de fichiers Excel en CSV et ils devraient être conservés dans le répertoire nouvellement créé.

Le script convertit le XLSX avec des feuilles simples et multiples en fichiers CSV séparés et les stockent dans de nouveaux répertoires avec le même nom.

Pour récupérer tous les fichiers Excel situés dans le répertoire actuel, la fonction globulaire est utilisée. Après cela, des dossiers sont créés pour chaque fichier xlsx en utilisant le système d'exploitation.fonction mkdir. Un fichier CSV est ensuite créé pour chaque feuille à l'intérieur du nouveau répertoire en bouclant sur le nom de la feuille.

Méthode 2: Convertir XLSX en CSV à l'aide de modules OpenPyxL et CSV

Dans cette méthode, nous utiliserons les modules OpenPyxL et CSV pour convertir les fichiers XLSX en CSV. Pour lire et écrire des fichiers XLSX, XLSM, XLTX et XLTM 2010, le module Python OpenTyxl peut être utilisé. Le module CSV comprend des classes qui permettent la lecture et l'écriture de données tabulaires formulées par le CSV.

Pour lire ou charger notre fichier xlsx, nous utilisons la fonction Load_WorkBook () du module OpenPyxl. Vous pouvez utiliser cette fonction si vous avez besoin d'écrire ou de lire un fichier XLSX / Excel existant dans Python. Après l'activation d'Excel, nous utilisons le CSV.Fonction écrivain () pour créer notre fichier CSV. Ensuite, la boucle pour stocker les données dans les cellules de données du fichier CSV. Nous convertissons notre exemple.Fichier XLSX dans MyFile.CSV comme indiqué dans l'image suivante:

Conclusion

Dans ce tutoriel, nous vous avons donné une courte introduction aux fichiers XLSX et aux fichiers CSV. Nous avons expliqué les principales différences entre les deux formats de fichiers. Nous avons discuté de deux méthodes avec plusieurs exemples pour enseigner comment les fichiers XLSX avec des feuilles uniques ou multiples peuvent être convertis en fichiers CSV. Nous avons implémenté un exemple pour convertir simultanément plusieurs fichiers XLSX en fichiers CSV. Il peut être simple ou difficile de convertir les données d'Excel en CSV. Si vous n'avez qu'un seul fichier avec un petit nombre de feuilles, c'est simple. Mais sinon, cela peut être difficile.