Pandas Dataframe Map

Pandas Dataframe Map
Une méthode remarquablement rapide et efficace pour gérer et explorer les données est proposée par la bibliothèque Pandas. Les pandas peuvent combiner efficacement différents ensembles de données afin que nous ne rencontrions même aucun problème lors de l'évaluation des données. Pandas fournit la série, le dict et les dataframes. Les colonnes DataFrame seraient également la série. Nous utilisons la méthode «map ()» pour upadte la colonne et les attribuer au dataframe. La méthode «map ()» est utilisée pour mapper les valeurs des séries dans leurs entrées correspondantes. Nous pouvons également cartographier deux séries de la même longueur. Nous n'appliquons pas cette méthode «map ()» pour mapper deux dataframes. Dans ce guide, la méthode «map ()» est explorée pour que vous appreniez comment cette méthode «map ()» fonctionne en pandas.

Syntaxe:

# Série.map (arg, na_action = aucun)

Exemple 1:

Nous utilisons pratiquement la méthode «map ()» dans notre code pandas. Nous importons la méthode que Pandas fournit à l'aide du mot clé «Importer» et définissons les «Pandas en tant que PD». Cela nous aide dans notre code où nous devons accéder aux méthodes de pandas. Nous ne mettons que «PD» pour faire cela. Maintenant, cette liste ou cette série qui est créée ici est nommée "Score_Data".Nous insérons le «First_name» qui comprend «Emma, ​​Robert, Leonard, Howard et Jessica». Ensuite, nous avons le "Last_name" qui contient "Edward, Samuel, Herry, William et Fowler". Nous ajoutons «42, 36, 46, 45 et 39» dans la liste «Age».

Après cela, nous avons le «score_1 et score_2» où nous ajoutons «9, 8, 6, 7, 5» et «28, 45, 59, 62, 70», respectivement. Nous changeons ce "score_data" en "score_df" et mentionnons le "premier_name, last_name, age, score_1 et score_2" comme colonnes. Donc, il est défini comme l'en-tête du dataframe. Nous imprimons le «score_df» sur le terminal. Après cela, nous faisons un dictionnaire des «sujets» et insérons les noms de sujet en mentionnant le premier_nom avec le nom de sujet. Dans le dictionnaire, nous ajoutons «l'ordinateur, la chimie, les mathématiques, l'astronaute et la science» en mentionnant le «premier_. Maintenant, nous cartographions ce dictionnaire au «score_df» mentionné précédemment.

Nous créons une nouvelle colonne nommée «Sujets». Nous mentionnons la colonne "First_name" et utilisons la méthode "map ()" pour cartographier les sujets dans ce "score_df". Après avoir cartographié la colonne du sujet au «score_df», nous affichons le «score_df». Cela ne s'affiche que lorsque nous utilisons la méthode «print ()».


Maintenant, nous compilons et exécutons ce code Pandas dans "Spyder". Il existe deux façons d'exécuter ce code. L'un d'eux consiste à appuyer sur les touches «Shift + Enter» et l'autre consiste à exécuter le code en cliquant sur le bouton «Exécuter» de l'application «Spyder». Après l'exécution, nous obtenons la sortie donnée. Le premier dataframe contient cinq colonnes. Nous cartons la colonne à cette «score_df» à l'aide de la méthode «map ()» qui est également indiquée dans l'illustration suivante:

Exemple 2:

Maintenant, nous commençons un nouvel exemple en important les «pandas en tant que PD» et en créant une liste imbriquée qui est nommée «AC_LIST». Cette liste imbriquée est constituée de trois colonnes nommées "AC_NAME, AC_NUM, JOINT". Les «AC_NAME» ont les noms «James, Melissa, Farnham, Samuel, Bromley, Coghill et Fuller». Le «AC_NUM» contient les numéros du compte en tant que «AC4319, AC1234, AC3498, AC4525, AC4439, AC2624 et AC1501». Dans la participation, nous ajoutons le mois de la participation qui sont «juin, avril, mai, août, février, janvier et décembre». Le «AC_LIST» est transformé en DataFrame «AC_DF» parce que nous utilisons le «PD.Trame de données". Nous mettons cette méthode «ac_df» sur la méthode «print ()». Il est rendu lorsque nous exécutons le code.

Après cela, nous générons un dictionnaire et le sauvons dans des «genres». Nous avons mis les sexes «masculin et féminin» pour les données que nous avons insérées dans la liste précédente. Nous mapperons également ce dictionnaire au dataframe que nous avons créé. Pour cartographier les «Genders» dans ce «AC_DF», nous créons d'abord une nouvelle colonne appelée «Gender», mentionnons la colonne «Prénom», puis utilisons la méthode «Map ()». Dans cette méthode, nous insérons les «genres». Nous affichons le «AC_DF» après avoir cartographié la colonne «Gender». Ceci n'est affiché que lorsque nous utilisons la méthode «print ()».


Nous obtenons la sortie spécifiée lorsque le code susmentionné est exécuté. Trois colonnes constituent le premier DataFrame. Nous cartons ensuite la colonne "Gender" à cette "AC_DF" en utilisant la technique "map ()", qui est également démontrée ici. «Nan» est affiché, ce qui indique que nous n'avons inséré aucune valeur.

Exemple 3:

Dans cet exemple, nous créons la série Pandas après l'importation des pandas. Nous générons cette série Pandas en utilisant le «PD.Méthode de la série »de pandas. Ce «PD» accède à cette méthode «série». Nous insérons des données à cette série et enregistrons la série dans la variable «Animals». Cette série contient «lapin, vache, rat, chien, souris et ours».

Ensuite, nous affichons cette série. Après avoir affiché la série «Animals», nous cartographions une ligne à toutes les valeurs de la série. Nous utilisons la méthode «map ()» et insérez «Je suis un ». Insérez le nom des animaux un par un dans ces accolades bouclées. Ensuite, imprimez-les, ce qui signifie qu'il affiche cette ligne avec tous les noms d'animaux. Il rend la série après cartographie telle qu'elle est écrite à l'intérieur de la méthode «print ()».


Vous pouvez voir que les noms d'animaux sont rendus dans une série. Ensuite, il mappe la ligne que nous avons écrite précédemment avec tous les noms d'animaux et imprime la chaîne «Je suis un» avec tous les noms d'animaux.

Exemple 4:

Maintenant, nous importons les pandas ainsi que la bibliothèque Numpy car nous utilisons la fonction ou la méthode des pandas et de Numpy dans cet exemple. Nous générons la «list» qui contient le «C_FEE» et le «C_DUR». Dans le «C_FEE», nous mettons «22000, 25000, 23000, NP.Nan et 26000 ”. Ici, «NP.Nan »signifie que nous obtenons cette valeur de la bibliothèque Numpy. Ensuite, nous avons mis les données dans le «C_DUR» qui est «20 jours, 50 jours, 40 jours, 35 jours et 45 jours». Ce "c_list" est converti en "C_DF".

Ensuite, nous appliquons certaines fonctions dans cette méthode «map ()». Nous utilisons ici la méthode «Lambda» et remplaçons 10% des valeurs «c_fee». Ceci est sauvé dans une autre colonne que nous avons ajoutée ici avec le nom de «frais». Nous mapperons ces «frais» avec la colonne «C_FEE». Ensuite, nous utilisons la méthode «print ()». Le «C_DF» s'affiche une fois que la colonne «Gender» est mappée.


Deux colonnes sont apparues ici avant la cartographie. Lorsque la méthode «map ()» est appliquée, une nouvelle colonne «frais» est insérée avec ces deux colonnes. Il affiche la valeur après avoir substitué 10% des valeurs «C_FEE». À la place de «Nan», il rend également «Nan» dans la colonne «Fairs» car il n'y a aucune valeur présente dans le «C_FEE» auquel le calcul est appliqué.

Conclusion

L'objectif principal de ce guide est de fournir des informations très bien, faciles et descriptives sur la fonction «map ()» dans Pandas.Ce guide a expliqué le concept de la fonction «map ()» d'une manière bien élevée. Nous vous avons montré comment utiliser la fonction «map ()» dans les codes ici. Comme nous l'avons expliqué, la méthode «map ()» est utilisée pour mapper les valeurs de la série dans leurs entrées correspondantes. Nous avons illustré quatre exemples de ce guide où nous avons utilisé la méthode «map ()». Après avoir bien appris ce guide, nous espérons que vous pourrez utiliser facilement cette méthode «map ()» en pandas.