Série Pandas à CSV

Julien Dumas

Les séries.TO_CSV () ”Méthode dans Pandas produit l'objet de série spécifié dans une notation de valeurs séparées par des virgules (CSV). Cette fonction prend simplement les valeurs d'une série et modifie leur format en ajoutant des virgules pour la séparation de l'index et des valeurs de colonne.

Pour utiliser cette fonction, nous devons utiliser la syntaxe suivante:

Cet article vous fournira deux techniques différentes pour apprendre les moyens d'utiliser cette méthode dans un programme Python.

Exemple n ° 1: utilisation de la série.TO_CSV () Méthode pour convertir une série avec DateTimeIndex en valeurs séparées par des virgules

Pour modifier une série dans un format CSV, nous utiliserons la «série.fonction à_csv () ». Cette illustration générera une série avec un DatetimeIndex, puis la convertira en un format de valeurs séparées par des virgules.

Pour mettre cette méthode en opération, nous devons avoir un outil qui prend en charge la programmation Python. L'outil «Spyder» est choisi pour compiler les codes. Pour écrire le script dessus, nous avons d'abord lancé l'outil installé dans notre système. Le programme Python a besoin d'une bibliothèque pour exercer ses méthodes pour atteindre le résultat requis. La bibliothèque que nous avons chargée ici est les «pandas». Dans la même ligne de code, l'alias de cette bibliothèque est identifié comme «PD». Donc, partout dans le programme, nous devons écrire des «pandas» pour accéder à une fonction. Nous écrivions plutôt «PD».

La première étape pour commencer par le code est de générer une série Pandas. Nous devons écrire «PD» pour utiliser la méthode de création de la série à partir de pandas. Le «PD.Série () ”La fonction est appelée pour construire une série avec les valeurs spécifiées. Les valeurs que nous avons fournies pour la série sont «Istanbul», «Izmir», «Ankara», «Ankara», «Antalya», «Konya» et «Bursa». Si vous souhaitez donner un nom à ce tableau de valeurs, vous pouvez le faire en utilisant le paramètre «Nom». Ici, nous avons nommé ce tableau de valeurs «villes» car elle tient les noms de 6 villes. Pour stocker cette série, un objet de série «Turquie» a été créé.

Pour créer un DatetimeIndex, nous avons invoqué le «PD.Date_range () ”Méthode. Entre les parenthèses de cette fonction, nous avons passé 4 arguments qui sont: «démarrer», «freq», «périodes» et «tz».

L'argument «Start» prend une date et une heure pour commencer à générer une plage de dates à partir de celui-ci. Ici, nous avons spécifié la date de début et l'heure comme «2022-03-02 02:30». Le paramètre «Freq» classe la fréquence de la plage de dates. Donc, nous l'avons fourni la valeur «D». Maintenant, cela créera une plage de dates sur la fréquence quotidienne. L'argument «période» est défini sur «6», ce qui signifie qu'il générera une plage de dates pendant 6 jours. Le dernier paramètre est «tz» qui spécifie le fuseau horaire pour la zone spécifiée. Nous avons spécifié le fuseau horaire pour «Asie / Istanbul».

Pour stocker cette plage de dates, nous avons créé une variable «DateTime» variable. Pour définir le DatetimeIndex, nous avons utilisé la «série.Index »Propriété. Le nom de la série «Turquie» est fourni avec le «.Index »Propriété et lui attribuée la plage de temps de date stockée dans la variable« DateTime ». Ainsi, la propriété «Index» prendra les valeurs de la variable «DateTime» et fera d'eux la liste d'index de la série «Turquie». Enfin, pour afficher la série de sortie, nous avons utilisé la méthode «print ()» et passé la série «Turquie» en entrée pour afficher son contenu.

Nous venons d'appuyer sur l'option «Exécuter le fichier» pour exécuter le script. Par conséquent, nous pouvons voir une série avec le DatetimeIndex à partir de «2022-03-02 02: 30: 00 + 03: 00» et se terminant à «2022-03-07 02: 30: 00 + 03: 00» Création d'une période de 6 jours. Ci-dessous de la série le «Freq: D», le nom de la liste des tableaux «villes» et de «l'objet» DType sont également mentionnés.

Maintenant, nous apprendrons à convertir cette série que nous venons de voir dans l'instantané ci-dessus en format CSV. Pour modifier la série aux valeurs séparées par des virgules, nous avons une méthode fournie par le module Pandas qui est «Series.to_csv () ". Cette méthode prend les valeurs de la série fournie et ajoute des virgules entre les valeurs de la colonne.

Les séries.to_csv () ”La fonction est appelée. Le nom de la série que nous voulons convertir est mentionné avec la méthode comme «Turquie.to_csv () ". Pour préserver les valeurs séparées des virgules, nous avons créé une variable «Comma_separisée», puis mis son contenu sur la fenêtre de sortie en invoquant la fonction «print ()».

Voici notre série au format CSV. Nous pouvons voir dans l'instantané que l'index et les valeurs de la série ont été séparés en utilisant les virgules en eux.

Exemple n ° 2: utilisation de la série.TO_CSV () Méthode pour convertir une série avec des valeurs NAN en valeurs séparées par des virgules

La deuxième technique pour exercer la «série.TO_CSV () »est d'appliquer cette méthode pour convertir une série qui maintient des entrées nulles dans un format CSV.

Nous avons initialement importé les packages nécessaires. Le «PD» est fait un alias pour les pandas et le «NP» comme alias pour Numpy. La boîte à outils Numpy est chargée ici car nous ferons des entrées nulles dans notre série en utilisant «NP.Nan "tout en le créant en utilisant le" PD Pandas.Méthode série () ”.

Le «PD.Série () ”La fonction est invoquée pour construire une série Pandas avec ces valeurs:« Nile »,« Amazon », NP.Nan, «Gange», «Mississippi», «NP.Nan "," Yangtze "," Danube "," Mekong "," NP.Nan "et" Volga ". Il y a un total de 21 valeurs définies pour la série à partir de laquelle 3 entrées détiennent «NP.NAN ”Valeurs, ce qui signifie que 3 valeurs sont manquantes dans la série. La propriété «Nom» spécifie le nom de ce tableau de valeurs que nous avons fourni des «titres». La propriété «Index» est utilisée pour définir la liste d'index définie par l'utilisateur au lieu d'aller avec la liste par défaut.

Ici, nous voulons la liste d'index avec les valeurs «10», «11», «12», «13», «14», «16», «17», «18», «19», «20», et 21 ”. Maintenant, notre série aura la liste d'index à partir de «10» au lieu de «0». Maintenant, stockez cette série afin que nous puissions l'utiliser plus tard dans le programme. Nous avons initialisé un objet de série «rivières» et lui allouant la série de sortie générée en appelant le «PD.Méthode série () ”. La série peut être vue en la mettant en affichage en utilisant la fonction «print ()» par Python.

La sortie rendue sur le terminal a imprimé une série dont la liste d'index part à partir de 10 et se termine à 21, ce qui signifie que la série a 21 valeurs.

La série sera transformée en format CSV avec la «série.TO_CSV () »Méthode.

Nous avons invoqué la «série.TO_CSV () "Méthode avec notre série" Turquie ". Par conséquent, cette méthode prendra les valeurs de la série «Turquie» et les convertira en un format de valeurs séparées par des virgules. Le résultat est enregistré dans la variable «converti_csv». Et finalement, la série convertie est imprimée à l'aide de la fonction «print ()».

Dans l'instantané du résultat ci-dessous, vous pouvez voir que les valeurs de la série sont désormais modifiées d'une manière où une virgule est utilisée pour les séparer de la liste d'index. De plus, là où les valeurs sont manquantes, seul le numéro d'index est imprimé avec une virgule.

Conclusion

La modification d'une série Pandas à un format CSV est une approche pratique. Cela peut être réalisé en utilisant la série Pandas «Series.fonction à_csv () ». Ce guide a mis en pratique deux techniques pour utiliser cette méthode. Dans la première illustration, nous avons invoqué cette méthode pour convertir une série avec un DatetimeIndex en un format de valeurs séparées par des virgules. La 2ème instance a utilisé la «série.TO_CSV () ”Fonction Pour modifier une série avec quelques entrées manquantes dans un format CSV. Les deux techniques ont été pratiquement implémentées à l'aide de l'outil «Spyder» sur le système d'exploitation Windows.

c Sharp

Qu'est-ce que le système.Espace de noms IO en C #

Système.IO est un espace de noms dans le C # qui fournit un ensemble de classes, de structures, d'én...

Julien Dumas

Salesforce

Salesforce Apex - Liste

Tutoriel pratique sur la collection «liste» dans le langage de programmation Apex et ses méthodes et...

Lena Martinez

Salesforce

Chargeur de données Salesforce

Tutoriel sur la façon d'insérer, de supprimer et de mettre à jour les données Salesforce, et comment...

Nathan Blanc