Pandas de JSON

Pandas de JSON

La notation d'objet JSON ou JS est un format de données texte qui stocke les données texte comme valeur clé. Sur Internet, les données sont fréquemment échangées via des fichiers JSON. Entre les supports bouclés (), le JSON est représenté. JSON utilise des virgules pour désigner la séparation de chaque paire de clés / valeur. JSON Data ressemble à un dictionnaire Python en apparence. Cependant, les dictionnaires sont des structures de données, tandis que JSON est un format de données. Dans Pandas, la fonction read_json permet à la lecture des fichiers JSON à Pandas DataFrame. Vous pouvez voir dans les exemples ci-dessous comment convertir les fichiers JSON en Pandas DataFrame Les fichiers JSON peuvent être lus dans le DataFrame de Pandas.

Comment lire les fichiers JSON dans Pandas?

Nous utilisons la fonction read_json () pour extraire les fichiers ayant le .Extension JSON en passant le chemin du fichier JSON souhaité à l'intérieur des parenthèses de la fonction. Une fois terminé, un «dataframe» (une table avec des lignes et des colonnes pour stocker les données) est renvoyée. Nous pouvons spécifier le lien vers l'emplacement du fichier plutôt qu'un chemin local si nous souhaitons récupérer un fichier JSON qui est stocké sur un serveur distant. Parfois, vous devrez peut-être transformer un fichier avec un .Extension JSON dans Pandas DataFrame. La méthode pandas read_json (), qui utilise la syntaxe suivante, facilite la réalisation de cela.

Syntaxe: read_json ('path', orient = 'index')

Où,

chemin: place le chemin du fichier JSON.

Orient: L'orientation du fichier JSON. La valeur par défaut est «index», mais vous pouvez également définir «Split», «enregistrements», «colonnes» ou «valeurs».

Voyons comment les fichiers avec les extensions de JSON peuvent être lus dans une dataframe dans les exemples ci-dessous.

Exemple 1: Utilisation de la fonction read_json () pour lire un fichier JSON

Tout d'abord, nous devons télécharger un fichier JSON sur le site Web open source. Nous pouvons simplement télécharger un fichier avec un .Extension JSON de plusieurs sites Web. Au lieu d'obtenir un fichier JSON sur Internet, vous pouvez également en créer un. Nous avons téléchargé un fichier 'iris.JSON 'à partir d'un site Web open-source. Pour lire ce fichier dans Pandas, nous utiliserons la fonction read_json ().

Nous avons utilisé le PD.Méthode read_json () pour lire le fichier local (.Fichier JSON) dans la variable 'df'. Nous avons passé le chemin de fichier JSON en tant que chaîne à la fonction. Avec cette méthode, dans les fichiers JSON, les données seront automatiquement converties en dataframe. Le package Pandas a été initialement importé comme PD. Dans la ligne finale, nous exportons les dix échantillons de lignes à partir du dataframe. La méthode read_json () a pris les 150 lignes et 5 colonnes de données du fichier de données de l'iris comme entrée.

En utilisant le DF.Fonction échantillon, nous n'avons affiché qu'un échantillon de 5 lignes de données dans ce bloc de sortie. Les données de DataFrame sont récupérées au hasard par la fonction échantillon (). Un nombre défini de lignes (aléatoire) est renvoyé par la méthode échantillon (). Si une valeur n'est pas spécifiée, la fonction échantillon () renvoie 1 ligne. Si nous spécifions le paramètre orient.

Exemple 2: Utilisation de la fonction read_json () pour lire un JsonFile à partir de l'emplacement distant

Un fichier situé sur un autre système CICS (système de contrôle des informations client). En utilisant l'expédition de la fonction CICS, les demandes de contrôle de fichiers CICS effectuées sur des fichiers distants sont envoyées au système distant. Les applications peuvent être présentées pour accéder aux fichiers même lorsqu'ils sont placés à un emplacement / serveur inconnu. En utilisant l'URL distante au lieu du chemin du fichier, nous pouvons lire les données JSON à partir d'un emplacement distant. La méthode read_json () peut lire à partir de lieux autres que les fichiers locaux. Les fichiers JSON conservés sur des serveurs distants peuvent également être lus. Nous pouvons simplement fournir l'appel de la fonction avec le chemin d'accès au fichier JSON externe.

Nous avons utilisé une API HTTP accessible au public qui contient des données de format JSON. La méthode read_json () est également utilisée pour lire les données JSON de l'URL distante. Cette sortie contient un échantillon de cinq lignes de données JSON à l'aide de la méthode read_json (). Ces données proviennent d'une URL publique et comporte 150 lignes et cinq colonnes.

Exemple 3: Utilisation de PD.Fonction DataFrame () Pour lire un fichier JSON dans Pandas DataFrame

Dans les exemples précédents, nous avons téléchargé le fichier de données JSON ou utilisé l'URL distante pour lire les données. Maintenant, nous allons créer des données JSON, puis nous les convertirons en une dataframe à l'aide du PD.Fonction DataFrame (). Avant de créer les données JSON ou Pandas DataFrame, nous devons importer les modules de Pandas pour utiliser ses fonctions et fonctionnalités.

Nos données JSON 'J_Data' sont créées avec deux colonnes: «Nom» et «Age» avec Values ​​('1': 'Brock', '2': 'Fin', '3': 'John', '4': 'Moris', '5': 'Jack', '6': 'Anna') et ('1': 38, '2': 26, '3': 41, '4': 35, '5': 28, «6»: 27) respectivement. Maintenant, nous allons passer nos données JSON à l'intérieur du PD.Fonction DataFrame () pour les lire dans le DataFrame.

Nous avons simplement passé la fonction 'J_Data' à l'intérieur de la fonction DataFrame () pour convertir les données JSON en Pandas DataFrame.

Exemple 4: Utilisation de PD.Fonction DataFrame () Pour lire une structure JSON imbriquée dans Pandas DataFrame

Nous créerons des données JSON en utilisant des dictionnaires imbriqués, dans cet exemple. Dans Python, vous pouvez utiliser des dictionnaires imbriqués pour créer des données JSON. Il y a une colonne ou une variable dans le fichier JSON pour chaque élément du dictionnaire extérieur. La clé de chaque élément est l'en-tête de colonne et ses données sont un autre dictionnaire composé des lignes dans cette colonne spécifique. Nous allons créer un dictionnaire que nous utiliserons pour créer un fichier JSON avec des détails sur certains aléatoires.

Nous avons créé nos données JSON imbriquées. Les clés des dictionnaires sont spécifiées comme «nom», «id», «cours» et «âge». Maintenant, nous allons utiliser le PD.Fonction DataFrame () pour convertir le dictionnaire imbriqué en pandas dataframe.

Notre DICTIONNAIRE NESSET des données JSON est convertie avec succès en un dataframe.

Exemple 5: Utilisation de la fonction JSON_NORMALINE () Pour lire une structure JSON imbriquée dans Pandas DataFrame

Pour lire les chaînes JSON imbriquées et renvoyer un dataframe, la fonction "json_normalize ()" est couramment utilisée. Le json.La fonction Loads () du package JSON Python doit d'abord être utilisée pour lire la chaîne JSON avant d'utiliser la méthode JSON_NORMALINE (). La fonction JSON_Normalize () recevra alors cet objet JSON et renverra les données requises sous la forme d'un dataframe.

Avec les pandas, nous avons également importé les modules JSON et JSON_Normalize pour utiliser les fonctions et les fonctionnalités qui leur sont fournies. Nous avons utilisé le JSON.charges () pour lire les cordes JSON. Un objet de fichier est transmis à JSON.lourde (), qui renvoie un objet JSON. Il est utilisé pour lire des données qui ont été codées par JSON à partir d'un fichier, la transformer en dictionnaire Python, puis désérialiser le fichier d'origine. Les données requises ont été contenues par la clé «Rec» qui est ensuite adoptée dans la fonction JSON_NORMALINE () pour aplatir les données dans Pandas DataFrame.

Conclusion

Dans ce tutoriel, nous avons discuté des fichiers de données JSON et de la façon dont nous pouvons les lire en utilisant la fonction read_json (). Nous avons vu la syntaxe de la méthode read_json () pour comprendre comment cela fonctionne. Nous avons implémenté quelques exemples dans cet article pour vous apprendre à lire un fichier JSON à partir d'un emplacement local et distant à l'aide de la fonction read_json () et comment lire ou convertir le fichier JSON et la structure JSON imbriquée en pandas dataframe à l'aide du PD.Fonction DataFrame () et JSON_Normalize ().