Pandas Convert Series en DataFrame

Pandas Convert Series en DataFrame
Pandas est un ensemble d'outils de manipulation de données basés sur Python. Parmi d'autres fonctionnalités, il peut également analyser de nombreux formats de fichiers et transformer l'ensemble de la table de données en un tableau de matrice Numpy. En conséquence, Pandas est un collaborateur fiable d'apprentissage et de science des données.

La série Pandas est un tableau unidimensionnel comprenant des étiquettes sur les axes. L'objet accepte à la fois l'indexation basée sur les étiquettes et a une profusion de techniques pour exécuter les actions liées à l'index. La génération de nouvelles colonnes de la série dérivée ou actuelle est un défi exigeant dans l'ingénierie des fonctionnalités. En utilisant les fonctionnalités natives de Pandas, la série ou la colonne nouvellement générée pourrait être transformée en un dataframe.

Pandas Convert Series en DataFrame

La conversion d'une série en une dataframe dans Pandas est une approche assez simple. Pour transformer efficacement une série en un cadre de données, les pandas utilisent le encadrer() fonction.

Cette fonction utilise la syntaxe suivante:

Il a un paramètre «nom». Si la série a un nom, il doit être utilisé à la place du nom passé. La représentation de la série Dataframe sera renvoyée par cette fonction.

Dans ce tutoriel, nous expliquerons votre méthode pour convertir la série Pandas en DataFrame à l'aide d'exemples pratiques.

Exemple 01: Utilisation de pandas .TO_FRAME () Méthode pour convertir une série en DataFrame

Nous utilisons l'outil «Spyder», qui est un outil fiable et simple pour écrire et assembler des codes Python. Dans l'environnement «Spyder», nous ouvrons un nouveau fichier Python et commençons à écrire notre script. Comme nous travaillons avec les fonctionnalités de Pandas, donc l'exigence primaire et avant tout est d'importer des «pandas en tant que PD». Cela permet à toutes les fonctionnalités de pandas dans notre fichier python.

Nous créons ensuite une série «new_ser» en utilisant le «PD.Série () ”Méthode qui est utilisée pour construire une série Pandas. Nous initialisons la série avec huit valeurs entières qui sont «8», «4», «3», «9», «11», «6», «15» et «21». Cette série est stockée dans la variable «new_ser». Nous pouvons maintenant accéder à la série en utilisant ce nom de variable.

Maintenant, nous devons voir notre série de pandas nouvellement créée. Ici, les pandas nous fournissent une fonction «print ()» qui affiche les données stockées dans une variable ou un objet qui lui a été transmis. Comme nous voulons imprimer la série «new_ser», nous utilisons donc cette variable comme paramètre dans les accolades de la fonction «print ()».

Appuyez sur le bouton «Exécuter Fichier» situé à l'en-tête de l'outil «Spyder». Ou alternativement, vous pouvez utiliser les touches "Shift + Enter" pour exécuter le script. Maintenant, la sortie peut être vue sur le terminal. Nous créons d'abord une série puis lui attribuons 8 valeurs entières qui peuvent être observées dans l'image de sortie fournie ci-dessous.

Vérifions le type d'objet de la variable «new_ser». Nous utilisons la méthode «type ()» pour trouver le type d'objet. Nous devons fournir l'objet ou le nom de variable, dont nous devons afficher le type d'objet dans les parenthèses de cette fonction. Comme nous l'avons inclus la variable «new_ser» en tant que paramètre à la fonction «Type ()». Nous insérons ensuite la fonction «type ()» à l'intérieur de la fonction «print ()» car nous avons inclus la variable «new_ser» en tant que paramètre de la fonction «Type ()».

Appuyez à nouveau sur le bouton "Exécuter le fichier" pour exécuter le fichier Python pour obtenir la sortie sur le terminal. Il vérifie si un paramètre y est transmis lorsque la fonction «print ()» est invoquée. Nous l'avons fourni la fonction «Type (New_Ser)», il affichera donc le type d'objet de l'objet «new_ser». L'image de sortie montre dans la dernière ligne ".Extension de série », ce qui signifie que l'objet est de type série.

Nous allons maintenant convertir la série "New_ser" en Pandas DataFrame. Pour cette conversion, les pandas nous fournissent une méthode très simple et directe qui est "to_frame ()". Nous avons créé un objet DataFrame ou une variable «new_df» et lui avons attribué la sortie de l'invoquer la méthode «to_frame ()». Nous devons utiliser la fonction «to_frame ()» avec le nom de l'objet de la série, que nous voulons convertir en dataframe.

Nous avons également utilisé le paramètre de cette fonction «Nom» et lui avons attribué le nom «Nombres» car nous avons utilisé «New_ser.to_frame (name = 'nombres') ". Il sera présenté comme le nom de la colonne dans le dataframe. Ensuite, nous utilisons la méthode «print ()» avec l'objet DataFrame comme paramètre pour afficher le DataFrame résultant. Ici, nous utilisons une autre fonction «print ()» avec la fonction «Type ()» pour déterminer le type d'objet pour la variable «new_df».

Vous pouvez voir dans l'image de sortie la série que nous créons, puis le DataFrame que nous avons généré à partir de la série avec succès. Pour la vérification de l'objet Type La méthode «Type ()» définit les types pour les deux objets. Au début, c'était «.Série », puis lorsque nous convertissons la série en DataFrame, elle s'est tournée vers«.Trame de données".

Exemple 02: Utilisation de pandas .TO_FRAME () Méthode pour convertir plusieurs séries en DataFrame

Dans l'illustration ci-dessus, nous convertissons une série en une série. Maintenant, cette démonstration expliquera comment convertir plusieurs séries en une dataframe.

Maintenant, nous construisons la série Pandas. Pour cette instance, nous créons 3 séries. La première série est «Nom» et il stocke cinq noms qui sont «Albert», «Boran», «Charlie», «Daren» et «Elsa». La deuxième série que nous générons est «points» qui contient la même longueur de valeurs qui est de 5 et a des valeurs «44», «10», «31», «52» et «18». La dernière série «Aide» contient des valeurs «10», «3», «7», «15» et «5.

Nous devons ensuite afficher toute la série un par un en utilisant la fonction «print ()». Nous utilisons d'abord l'objet «Nom» dans la fonction «print ()», puis «Points». Enfin, les «aides» sont transmises à la méthode «print ()».

Lorsque nous exécutons le code mentionné ci-dessus en appuyant sur le bouton «Exécuter le fichier» de l'outil «Spyder», nous obtenons 3 séries imprimées sur le terminal une après l'autre.

Nous utiliserons ici la méthode pandas «to_frame ()». Nous avons d'abord créé une variable «name_df» pour stocker le dataframe généré à partir de la série «Name» et nous attribuons la propriété de la méthode «TO_FRAME ()». Nous créons ensuite 2 autres variables en tant que «Points_DF» et «Assists_DF» pour stocker respectivement la série convertie de la série «Points» et «Aide». Nous attribuons le "POINTS_DF" un titre "Points" et "Asists_df" le titre "Aide" en utilisant la propriété "Name" de la méthode "TO_FRAME ()".

Nous créons un objet «Final» pour stocker le DataFrame complet. Pour lier les 3 données de données, nous utilisons le «PD.Concat () ”Fonctionne et transmettez les 3 données de données comme valeurs. Il liera toutes les dataframes dans une seule données complète et la stockera dans l'objet «final». Enfin, nous utilisons la méthode «Print (final)» pour afficher le DataFrame stocké dans l'objet «final».

Lorsque nous exécutons le code ci-dessus, nous affichons une série de données de données converties avec trois colonnes, nommées «Nom», «Points» et «Aides».

Conclusion

Cet article est un guide pour que vous appreniez et comprennent le concept de conversion en série en un pandas dataframe. Transformer une série en une dataframe est une pratique facile à l'aide de fonctionnalités Pandas. Nous vous avons d'abord expliqué les techniques pour convertir une seule série en une dataframe, puis nous avons expliqué la conversion de plusieurs séries en plusieurs dataframes, puis combinant toutes les châssis de données à colonne unique en une seule fois de données concaténée en utilisant la méthode "Concat ()" " de pandas. Nous avons également fourni une sortie pour chaque approche que nous avons utilisée. Nous prévoyons que cette écriture serait prouvée bénéfique pour saisir des fonctionnalités de pandas.