Exportation de pandas vers Excel

Exportation de pandas vers Excel
Le DataFrame est le composant central de presque toutes les opérations de pandas. Habituellement, vous enregistrez des données que vous importez à partir d'un fichier dans un objet Pandas DataFrame. Il reste à l'intérieur de l'objet DataFrame même après que des modifications y soient appliqués. Pour accéder aux données en dehors de Python, vous pouvez fréquemment besoin de l'exporter dans un format différent.

Dans ce tutoriel, nous vous expliquerons deux méthodes pour exporter un Pandas DataFrame dans un fichier Excel. La première technique consiste à invoquer le «DF.to_excel () ”pour l'exportation vers un fichier Excel. Le «PD.ExcelWriter () ”La méthode est la deuxième approche couverte dans cet article. Cette technique écrit des objets à la feuille de calcul Excel et les exporte ensuite vers le fichier Excel en utilisant la méthode «à excel».

Exemple n ° 1: Utilisation de Pandas DF.TO_EXCEL () Méthode

Pour exporter le DataFrame à Excel, nous avons besoin d'une bibliothèque préalable «OpenPyxl». Cette bibliothèque peut être installée dans l'environnement Python en exécutant la commande PIP «PIP install openpyxl».

En commençant par le script Python, nous avons d'abord chargé la bibliothèque Pandas. Le module Pandas est importé comme «PD» qui est aliasé pour les pandas. Pour exporter le datagramme pour exceller, nous devons créer principalement un dataframe. La construction de dataframe peut être réalisée en utilisant le «PD.Méthode DataFrame () ». Le «PD.La méthode DataFrame () »est invoquée pour générer des données de données avec 3 colonnes« langue »,« points »et« projets ». La colonne «Language» est de stocker les noms des langages de programmation qui sont «Java», «Python», «C ++», «R», «Kotlin» et «PHP».

Nous avons défini les valeurs de type entier pour la colonne «points» comme «10», «6», «20», «15», «9» et «14». La troisième colonne «Projets» a un nombre de projets pour chaque langue qui sont «11», «4», «8», «17», «6» et «5». Nous avons stocké cette dataframe dans l'objet DataFrame «prog». Pour afficher ce dataframe, nous avons utilisé la méthode «print ()» de Python.

Nous pouvons exécuter le script en appuyant ensemble sur les touches «Entrer + Shift» ou en cliquant sur le bouton «Exécuter le fichier». La console Python nous montre une fragmentation des données avec 3 colonnes et 6 lignes.

Le DataFrame a été créé de manière productive. L'exporter dans le fichier Excel est la tâche suivante. Par défaut, lorsque nous exportons un fichier DataFrame vers Excel / CSV, il est enregistré dans le répertoire de travail actuel de notre environnement Python. Vous pouvez également modifier ce paramètre en fournissant un chemin spécifié où vous souhaitez exporter le fichier. Nous travaillerons avec les paramètres par défaut dans ce cas.

Tout d'abord, nous devons voir le répertoire de travail actuel de notre environnement. Cela peut être fait en utilisant le script Python fourni ci-dessous:

Ici, nous avons trouvé notre répertoire de travail actuel qui est «Desktop». Cela signifie que les fichiers seront exportés vers le répertoire de bureau de notre système.

Maintenant, pour exporter le dataframe, nous avons une méthode «DF.to_excel () "fourni par Pandas. La méthode «to_excel ()» est invoquée avec le nom du dataframe qui est «prog». Entre les parenthèses de la fonction, nous avons spécifié le nom du fichier Excel comme «MyData» avec le «.Extension xlsx ”. Cela écrira l'objet DataFrame «prog» directement dans la feuille Excel. Le fichier Excel sera enregistré dans notre répertoire de travail actuel que nous avons déjà alloué sous forme de bureau.

Lorsque nous exécutons le script, le DataFrame sera exporté dans le fichier Excel sur le bureau. Nous avons ouvert le répertoire de bureau de notre machine et trouvé un fichier Excel nommé «MyData». L'ouverture du fichier nous affiche le dataframe que nous avons exporté dans le fichier "xlsx". Dans l'instantané attaché ici, vous pouvez observer que le nom de la feuille est comme spécifié "MyData".

Dans l'image ci-dessus, nous avons vu que les index sont stockés dans une colonne. Vous pouvez également éliminer également les étiquettes des colonnes. Cela peut être fait simplement en utilisant deux paramètres «index» et «en-tête».

Par défaut, les paramètres «Index» et «En-tête» sont définis sur «True». Lorsque nous n'en voulons pas, nous modifions simplement les paramètres par défaut en «faux» pour les deux arguments.

Ici, nous avons notre fichier Excel sans colonne d'index et les titres des colonnes.

Exemple # 2: Utilisation de Pandas PD.Méthode ExcelWriter ()

Cette démonstration vous apprendra une autre méthode d'exportation d'un Pandas DataFrame dans un fichier Excel.

Le programme a commencé par l'importation de la boîte à outils Pandas dans le fichier Python. Les fonctionnalités Pandas nous sont accessibles dans le fichier Python maintenant. Pour exporter une dataframe à Excel, nous devons d'abord en avoir un. Le DataFrame est généré en utilisant le «PD Pandas.Fonction DataFrame () ”. Nous avons invoqué le «PD.Méthode DataFrame () »et initialisé le DataFrame avec 4 colonnes. Les étiquettes de colonne sont «std_id», «économie», «géographie» et «histoire».

La colonne «STD_ID» stockait les ID des étudiants en tant que «1011», «1012», «1013», «1014» et «1015». Les marques de 3 sujets sont stockées dans des colonnes «Économie» ayant des valeurs «98», «60», «70», «65», 87 »; «Géographie» détenant les valeurs «51», «78», «88», «97» et «56»; et «Histoire» portant ces entrées «56», «76», «78», «65» et «79». Toutes ces colonnes doivent avoir la même longueur de valeurs.

Dans notre illustration, la taille de la colonne est 5. Le «PD.La méthode DataFrame () »lorsqu'elle est appelée pour créer un DataFrame avec ces valeurs, nécessite un objet où il peut stocker le DataFrame afin que nous puissions y revenir plus tard. Nous avons créé un «rapport» de l'objet DataFrame et lui avons attribué la sortie de l'appel le «PD.Méthode DataFrame () ». Pour afficher le dataframe à l'écran, nous avons utilisé la fonction «print ()».

Le Dataframe nouvellement créé avec 4 colonnes a été présenté sur la console Python.

Nous allons maintenant voir comment enregistrer ce DataFrame dans un fichier Excel en utilisant Pandas «PD.Méthode ExcelWriter () ». Le «PD.ExcelWriter () »La fonction est invoquée et entre ses parenthèses, nous avons défini le nom du fichier Excel avec le«.Extension xlsx "en tant que" Rapport.xlsx ”. Un «magasin» variable est construit pour stocker le résultat de «PD.ExcelWriter () ”qui sera un fichier Excel. Maintenant, nous avons une feuille Excel avec le nom «Reportcard.xlsx ”. Nous allons exporter le dataframe maintenant.

Pour cela, la méthode Pandas «DF.to_excel () ”est appelé. Le nom du «rapport» de DataFrame est annexé avec le «.TO_EXCEL () »Méthode. Le «magasin» variable, qui a un fichier Excel, est passé comme paramètre. Ainsi, le DataFrame sera exporté dans la «carte du rapport.Fichier xlsx ». Pour enregistrer le contenu de la table, nous avons une méthode «DF.sauvegarder()". La méthode «sauve ()» est utilisée et le dataframe est enregistré avec succès dans le fichier Excel. Gardez à l'esprit que ce fichier sera enregistré dans le répertoire de travail actuel de notre projet qui, dans ce cas, est le répertoire «Desktop».

La «carte du rapport.Le fichier xlsx »se trouve dans le répertoire de bureau de notre machine. Le fichier est lancé et ici nous voyons que le dataframe que nous avons créé est stocké dans ce fichier.

Conclusion

Cet article vous a fait familiariser avec deux stratégies pour atteindre le résultat souhaité. Les deux méthodes de pandas ont été discutées. La démonstration pratique des exemples de codes pour utiliser les deux méthodes a été effectuée sur l'outil Spyder. Le premier exemple a utilisé le «DF.TO_EXCEL () »Méthode pour exporter le DataFrame dans un fichier Excel tandis que la deuxième illustration a élaboré sur le« PD.Méthode ExcelWriter () »pour stocker le dataframe dans une feuille Excel.