Pandas dataframe à partir de la liste des dicts

Lena Dupuy

Une structure de données d'étiquette «à deux dimensions» appelée «pandas dataframe» a des colonnes qui pourraient être de nombreuses sortes. C'est généralement l'objet «pandas» qui est le plus utilisé. «Pandas» fournit diverses méthodes pour générer un Pandas DataFrame. Ce tutoriel est présenté ici, qui découvrira comment créer un dataframe à partir d'une collection de dictionnaires «pandas». Les dictionnaires peuvent être convertis en dataframes de diverses manières en utilisant des «pandas». Nous discuterons de toutes les méthodes avec une explication complète et détaillée de chacun d'eux dans ce tutoriel.

Méthodes de création de données de données à partir de listes de dict dans les «pandas»

Les méthodes utilisées pour créer le DataFrame à partir des listes de dictionnaires sont fournies ci-dessous. Dans ce guide, nous utiliserons également toutes ces méthodes données dans nos exemples pratiques et les expliquerons en détail ici. Ces méthodes sont:

PD.Trame de données()
PD.Trame de données.from_dict ()
PD.Trame de données.from_records ()
PD.jason_normalize ()

Maintenant, nous allons utiliser ces méthodes dans notre code «Pandas», et pour cela, nous avons l'outil «Spyder» dans lequel nous exécuterons notre code «Pandas». Voyons les exemples suivants:

Exemple 01

Chaque fois que nous voulons générer le DataFrame, nous devons avoir des listes de dictionnaires. Avant de créer les listes, nous devons importer les «pandas» comme «PD» parce que nous travaillons dans des «pandas», donc pour accéder à la fonction des pandas, nous mettons simplement «PD» au lieu de «pandas» pleine forme. Nous insérons certaines données dans les listes de dictionnaires. Le «Inventory_list» est créé ici, et nous mettons «SKU», qui apparaît comme le nom d'en-tête de la colonne. Dans cette colonne, nous ajoutons «SR7546» Le nom ou la touche de l'en-tête de colonne suivante est «Description» ici. Ensuite, nous mettons «Article 1», puis vient l'en-tête ou la clé de colonne suivante, qui est «bac #», et ajoutez «S234», la dernière colonne que nous avons est «l'emplacement», et nous y ajoutons l'adresse qui est «ABC Plaza Street 1».

Maintenant, nous ajoutons plus de données à ces colonnes en mettant le nom de chaque en-tête ou clé de colonne, puis en y insérant des données. Nous insérons "TW1234" dans "SKU", "Article 2" dans "Description", "S456" dans "Bin #" et "Cde Plaza Street 2" dans la colonne "Emplacement". Ensuite, nous mettons «SV4253, Article 3, S67 et Xys Plaza Street 2» dans la colonne «SKU, Description, Bin # et Location», respectivement. En fin de compte, nous insérons un record de plus, «STM2634, point 4, S97 et MNO Plaza Street 6».

Ici, le "Inventory_list" est terminé, et maintenant, nous convertissons cette "Inventory_list" en DataFrame. Nous utilisons le «PD.Méthode DataFrame »pour convertir les listes de dicts en dataframe. Nous plaçons le «Inventory_list» comme paramètre du «PD.Méthode DataFrame () », et nous stockons cela dans une variable« Inventory_DF ». Cet Inventory_DF est utilisé de sorte que lorsque les listes de dicts se transforment en dataframe, alors ce DataFrame est stocké dans ce "Inventory_DF". Maintenant, les listes de dicts sont converties en DataFrame, et nous déménageons pour imprimer le DataFrame, que nous obtenons après avoir appliqué ce «PD.Méthode DataFrame () ». Nous imprimons cette "Inventory_DF" en utilisant la fonction "print ()" dans "Pandas".

Comme nous utilisons l'outil «Spyder», pour la sortie, nous venons de frapper «Shift + Entrée», et la sortie est affichée sur son terminal. Ici, les données que nous insérons dans les listes de dicts sont présentées dans le dataframe en lignes et colonnes. Les noms d'en-tête sont également ajoutés en haut de chaque colonne.

Exemple # 02

Nous générons le «Student_list» ici de la même manière que nous avons créé «Inventory_list» dans l'exemple précédent. Nous avons d'abord importé les «pandas en tant que PD» et les avons déplacés vers «Students_list». Nous avons «S #», qui montre que c'est le nom d'en-tête de la colonne. En cela, nous placons «G6255», le nom ou la clé de la colonne suivante est ajusté en tant que «nom», et nous mettons également les données comme «George». «L'adresse» est également le nom de l'en-tête dans lequel nous ajoutons «ABC246». Les trois prochains noms ou touches d'en-tête de colonne sont «Mid_marks, Final_Marks et Pass / Fail», les données que nous avons ajoutées dans ces colonnes sont «33, 47 et Pass», respectivement.

De la même manière, nous ajoutons «G6256, Peyton, Def789, 38, 57» dans les cinq premières colonnes, mais nous n'ajoutons aucune donnée dans la colonne «Pass / Fail» ici. Ci-dessous, nous insérons des données dans les six colonnes sous le nom de «G6257, Elle, MNO456, 36, 55 et Pass». Dans la quatrième rangée, nous insérons à nouveau les données en seulement cinq colonnes, et nous ne mentionnons pas la sixième colonne. Nous ne mettons que «G6258, Smith, XYZ123, 31 et 67», qui est les données de cinq colonnes «S #, nom, adresse, mid_marks et final_marks», respectivement. Nous transformons cet «Student_list» en DataFrame en plaçant le «PD.Dataframe »et nommant le dataframe comme« student_df ».

Nous rendons également le «Student_DF» à l'aide de «print ()». Nous verrons dans la sortie comment il rend les cellules dans lesquelles nous n'avons ajouté aucune donnée.

Le «Student_DF» est rendu dans ce résultat. Les valeurs NAN sont ajoutées à la dataframe résultante car le dict ne contient aucune valeur et colonnes qui correspondent. Ici, il affiche «nan» dans les cellules où nous n'avons inséré aucune donnée, et il n'y a aucun effet sur l'ensemble des données s'il n'y a pas de valeurs correspondantes de clés dans le dataframe.

Exemple # 03

Comme nous le savons, lors de la génération d'un dataframe à partir d'une liste de dicts, les colonnes de la dataframe résultante contiennent les clés qui apparaissent sur l'en-tête de la colonne. Les clés que nous générons dans cet exemple sont "std_id, student_name, père_name, médiums, finales et total". Les clés correspondantes sont les colonnes, et leurs valeurs sont les lignes du dataframe lorsqu'elle est créée à partir d'une liste de dicts. Nous insérons également les valeurs qui apparaissent sur les lignes. Nous créons «stdnt_list» et y insérons des données sous les clés et leurs valeurs.

Ensuite, nous convertissons ce "stdnt_list" en un dataframe "stdnt_dataframe". Nous définissons également les valeurs d'index pour ce DataFrame, qui est "STD_1, STD_2, STD_3 et STD_4". Rendez ensuite le «stdnt_dataframe», qui rend également les valeurs d'index.

Dans ce résultat, le dataframe et les valeurs d'index que nous avons insérées dans notre code apparaissent.

Exemple # 04

Nous utilisons une autre méthode pour modifier la liste des dicts vers le dataframe. Nous utilisons le «PD.Trame de données.From_Records () ”Méthode, qui convertira notre liste de dicts en dataframe et rendra le dataframe résultant.

Voici le dataframe qui en résulte, dont nous obtenons en utilisant le «PD.Trame de données.From_Records () »Méthode. Cette méthode nous aide également à modifier la liste des dicts vers le dataframe.

Exemple # 05

Maintenant, nous passons d'une liste de dicts à un dataframe en utilisant une technique différente. Notre liste de dicts sera convertie en un dataframe à l'aide du «PD.Trame de données.From_dict () »Méthode dans cet exemple, et nous afficherons également le dataframe résultant.

Ceci est le dataframe produit à la suite de l'utilisation du «PD.Trame de données.From_dict () "Méthode. Cette méthode aide à convertir la liste des dicts en un dataframe.

Exemple # 06

Ici, nous utilisons une méthode différente et dernière pour passer d'une liste de dicts à un dataframe. Nous utilisons le «PD.Fonction json_normalize () ”pour transformer notre liste de dicts en un dataframe dans ce code et afficher le dataframe résultant en mettant la fonction" print () "à la fin.

Le DataFrame est créé lorsque le «PD.JSON_NORMALIE () "est appliqué. Cette technique aide également à générer le dataframe à partir de la liste des dicts dans les «pandas».

Conclusion

Ce tutoriel décrit comment utiliser la conversion de «Liste des dicts à DataFrame» dans «Pandas», afin que vous puissiez l'utiliser pour apprendre à le faire. Notre objectif principal est de vous fournir une explication approfondie, concise et claire du concept «convertissant la liste des dicts en dataframe». Nous avons discuté de quatre méthodes distinctes, qui nous aident à convertir la liste des dicts en dataframe. Nous avons démontré des exemples et utilisé toutes les méthodes que nous avons mentionnées dans ce tutoriel pour obtenir le DataFrame à partir de la liste des dicts.

Salesforce

Chargeur de données Salesforce

Tutoriel sur la façon d'insérer, de supprimer et de mettre à jour les données Salesforce, et comment...

Nathan Blanc

Commandes Linux

Comment installer la version de Cuda sur Linux

Tutoriel complet sur la façon de découvrir les versions de CUDA qui sont prises en charge par les pi...

Julien Dumas

Commandes Linux

Comment installer et activer l'authentification multi-facteurs SSH pour les systèmes Linux

Tutoriel sur la façon d'installer et d'activer le MFA pour l'accès SSH sur les systèmes Linux en con...

Lena Martinez