Pandas dataframe de dict

Pandas dataframe de dict
Un Pandas Dataframe peut être généré à l'aide d'un Python Dict (Dictionary) qui est une paire de valeurs clés. En temps réel, nous produisons généralement un Pandas DataFrame en important un fichier CSV ou une autre ressource, mais il est également possible de le générer à l'aide d'un objet dict (dictionnaire).

Les pandas Python sont fréquemment déployés dans la science des données / traitement des données et les tâches d'apprentissage automatique. Il est développé sur la base de Numpy, une autre bibliothèque Python proéminente qui prend en charge les calculs scientifiques. Dans Python, Pandas Dataframes est extrêmement utile pour travailler avec des données 2D (bidimensionnelles). Un Pandas DataFrame peut être construit dans une variété de méthodes, l'une d'entre elles est en extraction des données d'un dictionnaire donné.

Exemple 1: Utilisation du constructeur par défaut PD.DataFrame () pour générer un dataframe à partir d'un dictionnaire

Cette approche commence par générer un dictionnaire Python de listes, que nous passons ensuite au PD.Méthode DataFrame (). Le dernier mais non le moindre, le PD.La méthode DataFrame () sort un objet Pandas DataFrame contenant le contenu du dictionnaire des listes.

Maintenant, mettons-le en pratique en utilisant les scripts Python.

Dans le fichier Python, nous importons d'abord la bibliothèque nécessaire qui est des pandas dans cette illustration car nous utiliserons les fonctionnalités Pandas ici.

Nous créons ensuite un dictionnaire «données» et les initialisons avec trois listes avec les titres «nom», «âge» et «institut» respectivement. Nous attribuons chaque liste avec quatre valeurs. Nous invoquons la méthode print () pour afficher le dictionnaire sur le terminal.

La sortie que nous obtenons en exécutant le code précédent est jointe ici:


Nous convertissons maintenant ce dictionnaire Pandas en un Pandas DataFrame.

Aux fins de la génération de DataFrame à partir d'un dictionnaire, nous utilisons la méthode la plus simple. Ici, nous utilisons le constructeur par défaut de Pandas pour générer un dataframe. Un objet DataFrame avec le nom «Sortie» est créé et se voit attribuer la sortie de l'invoquer la PD.Fonction DataFrame (). Les «données» dictées que nous avons créées précédemment sont passées comme paramètre au PD.Fonction DataFrame (). L'instruction print () avec l'objet «sortie» comme un argument exécute pour afficher le dataframe créé à partir du dictionnaire spécifié.

Cela nous donne le résultat de données Pandas résultant suivant:

Exemple 2: Utilisation des index définis par l'utilisateur pour générer une dataframe à partir d'un dictionnaire

En utilisant un dictionnaire avec les index définis par l'utilisateur, nous pourrions construire un objet Pandas Dataframe dans Python. Cette technique commence en générant un dictionnaire Python, qui est ensuite passé simultanément avec la liste d'index sur le PD.Méthode DataFrame (). Le PD.La méthode DataFrame () renvoie finalement un objet Pandas DataFrame contenant le contenu du dictionnaire avec les index de la liste d'index fournis.

Nous explorerons ici comment le code Python est utilisé pour l'exécuter.

Pour créer un dataframe à partir d'un dict qui utilise des indices définis par l'utilisateur, nous devons d'abord avoir une liste de dictionnaire. Puisque nous avons généré un dictionnaire dans l'exemple précédent, nous utiliserons également le même dictionnaire dans ce cas.

Maintenant, pour construire le dataframe de dict, nous utilisons le même constructeur de données de données Pandas, mais avec une innovation de plus car nous voulons que le dataframe soit affiché avec des index que nous lui attribuons au lieu de ses indices prédéfinis. Nous utilisons le paramètre «Index» à l'intérieur de la parenthèse avec le nom du dict, séparé par une virgule. Nous attribuons les valeurs au paramètre «Index» à l'aide de l'opérateur d'attribution «=» et mettons les valeurs dans les supports. Enfin, nous utilisons la méthode print () pour montrer les résultats du programme.

L'image suivante montre la sortie DataFrame avec des indices définis par l'utilisateur «R, X, Y, Z» au lieu de la méthode d'indexation 0.

Exemple 3: Générez un DataFrame à partir d'un dictionnaire avec les colonnes nécessaires

Pour la troisième instance, certaines colonnes sont ignorées lorsque nous générons un dataframe à partir d'un dictionnaire. Le paramètre des colonnes rend la réalisation de cette tâche simple. En tant que paramètre, cet argument accepte une liste, les éléments qui sont les colonnes spécifiées. Il renvoie le dataframe avec les colonnes sélectionnées uniquement.

Voyons simplement la façon d'écrire un script Python pour générer un DataFrame à l'aide des colonnes de dictionnaire sélectionnées.

Dans cet exemple, nous avons ajouté un nouvel enregistrement au dict précédemment créé «Données» comme «rouleau» et l'avons attribuée avec la même longueur de valeurs que nous avons utilisée pour les trois autres enregistrements. Maintenant, collectivement, nous avons un dict avec 4 records. Lorsque nous exécutons la méthode print (), nous obtenons un dictionnaire avec quatre enregistrements cette fois.

Ceci est la sortie:

Maintenant, nous explorons comment nous pouvons construire un DataFrame à partir d'un dictionnaire avec certaines colonnes spécifiées.

La fonction Pandas DataFrame nous fournit une «colonne» paramètre pour spécifier les noms des colonnes que vous souhaitez particulièrement dans votre DataFrame. Entre les accolades du PD.Méthode dataFrame (), nous avons passé l'argument «colonnes» et attribué les noms des colonnes entre les crochets. Ici, nous avons choisi deux colonnes, «nom» et «institut». L'instruction print () est présentée sur le terminal comme le DataFrame qui contient uniquement les colonnes mentionnées précédemment.

Nous avons obtenu notre dataframe avec deux colonnes sélectionnées.

Exemple 4: Générez un DataFrame à partir d'un dictionnaire avec une orientation modifiée en utilisant la fonction from_dict ()

Semblable à la manière précédente, nous générons d'abord un dictionnaire Python de listes, puis les passons à DataFrame.From_dict () Méthode. Finalement, un objet Pandas DataFrame contenant les informations sur le dictionnaire des listes est renvoyé par le dataframe.From_dict () Méthode. Il existe diverses alternatives lorsque vous utilisez spécifiquement la fonction de dict () pour construire un dataframe à partir d'un dictionnaire. Les clés du dict seront, par défaut, ses colonnes, tout comme le comportement habituel. Les clés du dictionnaire sont indiquées comme des lignes lorsque l'orientation est «Index."

Ici, nous voyons d'abord les paramètres par défaut, puis modifions l'orientation en «index».

Nous utilisons les «données» du dict. Pour générer un dataframe à partir du dictionnaire, nous utilisons à la place la méthode from_dict (). Les clés du dictionnaire sont utilisées comme noms de colonne par défaut lors de l'utilisation de la méthode FROM_DICT (). Les entrées du dictionnaire sont utilisées comme valeurs de dataframe. Ainsi, nous exécutons cette méthode avec le paramètre par défaut et passons le nom du dict «données». Nous voyons la sortie via la fonction print ().

Ce qui suit est le résultat généré à partir du script Python précédent:

Maintenant, pour modifier l'orientation du dataframe généré à partir de la liste de dictionnaire fournie, nous modifions les paramètres par défaut de la fonction FROM_DICT ().

Lorsque vous fournissez l'argument orient = "index", un dataframe est construit en utilisant les valeurs des valeurs du dict si vous préférez utiliser les clés du dict comme lignes. Nous avons donc ajouté le paramètre «Orient» pour modifier l'orientation et attribuer la valeur «index». Cela signifie que l'orientation des valeurs de l'indice est passée des colonnes aux lignes.

Ceci est la sortie de ce programme:

Conclusion

Ce guide explique la génération d'une dataframe à partir d'une liste de dictionnaires. Nous avons élaboré toutes les différentes manières et aspects de l'utilisation de cette approche. Avec les exemples pratiques, nous vous avons fait comprendre comment utiliser la fonction Pandas Dataframe ainsi que la fonction Pandas de_DICT. La mise en œuvre étape par étape vous aidera à obtenir la meilleure expérience d'apprentissage à Python.