Comment lire le fichier Excel dans Python

Comment lire le fichier Excel dans Python

Le .xlsx est l'extension du document Excel qui peut stocker une grande quantité de données sous forme tabulaire, et de nombreux types de calcul arithmétique et logique peuvent être effectués facilement dans une feuille de calcul Excel. Parfois, il est nécessaire de lire les données du document Excel à l'aide du script Python à des fins de programmation. De nombreux modules existent dans Python pour lire le document Excel. Certains des modules utiles sont xlrd, openpyxl, et pandas. Les moyens d'utiliser ces modules pour lire le fichier Excel dans Python ont été affichés dans ce tutoriel.

Prérequis:

Un fichier excel factice avec le .L'extension XLSX devra vérifier les exemples de ce tutoriel. Vous pouvez utiliser n'importe quel fichier Excel existant ou en créer un nouveau. Ici, un nouveau fichier Excel nommé ventes.xlsx Le fichier a été créé avec les données suivantes. Ce fichier a utilisé pour lire en utilisant différents modules Python dans la partie suivante de ce tutoriel.

ventes.xlsx

Date de vente Vendeur Montant
12/05/18 Sila Ahmed 60000
06/12/19 Mir Hossain 50000
09/08/20 Sarmin Jahan 45000
07/04/21 Mahmudul Hasan 30000

Exemple-1: Lisez le fichier Excel à l'aide de XLRD

Le module XLRD n'est pas installé avec Python par défaut. Vous devez donc installer le module avant de l'utiliser. La dernière version de ce module ne prend pas en charge le fichier Excel avec le .Extension xlsx. Vous devez donc installer le 1.2.0 version de ce module pour lire le fichier xlsx. Exécutez la commande suivante à partir du terminal pour installer la version requise de xlrd.

$ pip install xlrd == 1.2.0

Après avoir terminé le processus d'installation, créez un fichier Python avec le script suivant pour lire le ventes.xlsx fichier utilisant le xlrd module. open_workbook () La fonction est utilisée dans le script ouvrir le fichier xlsx pour la lecture. Ce fichier Excel contient une seule feuille. Alors le cahier de travail.sheet_by_index () La fonction a été utilisée dans le script avec la valeur de l'argument 0. Ensuite, le imbriqué 'pour' Loop a utilisé pour lire les valeurs cellulaires de la feuille de calcul en utilisant les valeurs de ligne et de colonne. Les fonctions de deux plages () ont été utilisées dans le script pour définir la taille et la taille de la colonne en fonction des données de feuille. Le Cell_value () La fonction a utilisé pour lire la valeur cellulaire particulière de la feuille dans chaque itération de la boucle. Chaque champ de la sortie sera séparé par un seul espace d'onglet.

# Importer le module XLRD
importer xlrd
# Ouvrez le classeur
classeur = xlrd.Open_WorkBook ("Ventes.xlsx ")
# Ouvrez la feuille de travail
feuille de travail = classeur.sheet_by_index (0)
# Itérer les lignes et les colonnes
pour I à portée (0, 5):
pour J à portée (0, 3):
# Imprimez les valeurs de cellule avec l'espace d'onglet
imprimer (feuille de travail.Cell_value (i, j), end = '\ t')
imprimer(")

Sortir:

La sortie suivante apparaîtra après avoir exécuté le script ci-dessus.

Exemple-2: Lisez le fichier Excel à l'aide d'OpenPyxl

Le openpyxl est un autre module Python pour lire le fichier xlsx, et il n'est pas non plus installé avec Python par défaut. Exécutez la commande suivante à partir du terminal pour installer ce module avant de l'utiliser.

$ pip install openpyxl

Après avoir terminé le processus d'installation, créez un fichier Python avec le script suivant pour lire le ventes.xlsx déposer. Comme le module xlrd, l'OpenPyxl le module a le load_workbook () fonction pour ouvrir le fichier xlsx pour la lecture. Le ventes.xlsx Le fichier est utilisé comme valeur d'argument de cette fonction. L'objet du livre de wook.actif a été créé dans le script pour lire les valeurs du max_row et le max_column propriétés. Ces propriétés ont été utilisées dans les boucles imbriquées pour lire le contenu du ventes.xlsx déposer. La fonction Range () a été utilisée pour lire les lignes de la feuille, et la fonction iter_cols () a été utilisée pour lire les colonnes de la feuille. Chaque champ de la sortie sera séparé par deux espaces d'onglet.

# Importer le module Openyxl
importer openpyxl
# Définir la variable pour charger le livre Wook
wookbook = openpyxl.load_workbook ("Ventes.xlsx ")
# Définir la variable pour lire la feuille active:
feuille de travail = wookbook.actif
# Itérer la boucle pour lire les valeurs cellulaires
pour i à portée (0, feuille de travail.max_row):
pour Col dans la feuille de calcul.iter_cols (1, feuille de travail.Max_Column):
print (col [i].valeur, end = "\ t \ t")
imprimer(")

Sortir:

La sortie suivante apparaîtra après avoir exécuté le script ci-dessus.

Exemple-3: Lisez le fichier Excel à l'aide de pandas

Le module Pandas n'est pas installé avec Python comme le module précédent. Donc, si vous ne l'avez pas installé auparavant, alors vous devez l'installer. Exécutez la commande suivante pour installer le pandas du terminal.

$ pip install pandas

Après avoir terminé le processus d'installation, créez un fichier Python avec le script suivant pour lire le ventes.xlsx déposer. Le read_excel () La fonction des pandas est utilisée pour lire le fichier xlsx. Cette fonction a utilisé dans le script pour lire le ventes.xlsx déposer. Le Trame de données() La fonction a utilisée ici pour lire le contenu du fichier xlsx dans le cadre de données et stocker les valeurs de la variable nommée données. La valeur des données a été imprimée plus tard.

# Importer des pandas
Importer des pandas en tant que PD
# Chargez le fichier xlsx
excel_data = pd.read_excel ('ventes.xlsx ')
# Lisez les valeurs du fichier dans le dataframe
données = PD.DataFrame (excel_data, colonnes = [
«Date de vente», «vendeur», «montant»])
# Imprimez le contenu
print ("Le contenu du fichier est: \ n", données)

Sortir:

La sortie suivante apparaîtra après avoir exécuté le script ci-dessus. La sortie de ce script est différente des deux exemples précédents. Les numéros de ligne sont imprimés dans la première colonne, où la valeur de la ligne a compté à partir de 0. Les valeurs de date sont alignées de manière centralisée. Les noms des vendeurs sont corrects à droite. Le montant est aligné à gauche.

Conclusion:

Les utilisateurs de Python doivent travailler avec des fichiers XLSX à des fins de programmation différentes. Trois façons différentes de lire le fichier XLSX ont été affichées dans ce tutoriel en utilisant trois modules Python. Chaque module a différentes fonctions et propriétés pour lire le fichier xlsx. Ce tutoriel aidera les utilisateurs de Python à lire facilement le fichier XLSX à l'aide du script Python après avoir lu ce tutoriel.