Pandas Reindex

Pandas Reindex

«Dans« Pandas », nous pouvons stocker beaucoup d'informations sous forme tabulaire, qui est également connue sous le nom de DataFrame. Le «pandas» nous facilite la méthode «dataFrame ()» pour construire le dataframe. Le DataFrame contient des index, et nous pouvons également modifier les index du DataFrame en utilisant les fonctions «pandas». La méthode que nous utilisons pour le réindexer le dataframe est la méthode «Reindex ()». Cette méthode aide à modifier les valeurs d'index de la ligne ainsi que les valeurs d'index des colonnes. En utilisant cette méthode, nous pouvons modifier l'index par défaut du DataFrame, et nous pouvons également modifier l'index que nous définissons tout en créant le DataFrame. Nous utiliserons la méthode «reindex ()» dans nos exemples «pandas» dans ce tutoriel et expliquerons ce concept en profondeur ici."

Exemple # 01

L'outil «Spyder» nous aide à développer le code «Pandas» ici dans ce tutoriel, et nous commençons notre code avec le mot clé «Importer», ce qui aidera à importer la fonction «Pandas». Nous placons des «pandas en tant que PD» après avoir tapé «l'importation». Après cela, nous créons le dataframe en tapant «PD.Trame de données()". Nous écrivons ce «PD» ici parce que le «dataFrame ()» est la méthode de «pandas». Le «valeur_df» est le nom de la variable dans laquelle le dataframe est enregistré. Nous ajoutons «RandomName», qui est le nom de la colonne, et le «Randomname» contient «Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander et Samuel».

Ensuite, nous avons «Value_1», dans lequel nous avons inséré «16, 29, 24, 35, 44, 50, 69, 74 et 88». Vient ensuite «Value_2», et nous avons ajouté «25, 38, 42, 56, 54, 65, 78, 89 et 99». Maintenant, le «Value_3» vient ensuite, et nous placons «36, 48, 52, 69, 74, 75, 87, 91 et 69». La colonne «Value_4» est présente après cela, où nous avons inséré «52, 64, 72, 88, 82, 95, 97, 21 et 39». La dernière colonne est la colonne «Value_5» ici, et dans cette colonne, les valeurs que nous avons ajoutées sont «66, 78, 82, 99, 34, 45, 57, 61 et 89». Après cela, nous utilisons la fonction "print ()" dans laquelle "Values_df" est ajoutée ainsi. Il imprimera sur le terminal.


Après avoir appuyé sur «Shift + Entrée», nous pouvons facilement obtenir le résultat de nos codes dans l'application «Spyder». Ici, ce code renvoie le dataframe avec l'index par défaut. Maintenant, nous appliquerons la méthode «Reindex ()» pour réindexer cette dataframe dans «pandas».


La fonction «Reindex ()» est utilisée ici pour réindexer la valeur d'index de la ligne. Dans le dataframe ci-dessus, vous pouvez voir que les valeurs d'index par défaut de la ligne sont affichées, et maintenant, nous appliquons la méthode «reindex ()» pour réindexer ces index de ligne. Nous plaçons le nom de DataFrame, puis la méthode «Reindex ()» dans laquelle nous plaçons ces valeurs d'index que nous voulons ajouter au DataFrame ci-dessus. Nous mettons «Ind_A, Ind_B, Ind_C, Ind_D, Ind_E, Ind_F, Ind_G, Ind_H et Ind_i» dans la fonction «Reindex ()». Ainsi, les index de ces lignes seront mis à jour sur le DataFrame lorsque nous exécuterons ce code.


Les valeurs de l'index de la ligne sont affichées dans ce résultat, et vous pouvez noter que les valeurs de dataframe ne sont pas affichées ici, et les valeurs «nan» sont apparues. En effet. Lorsque le nouvel index et l'ancien index ne correspondent pas, alors il s'affiche «nan» là-bas. Ces valeurs «nan» apparaissent par défaut lorsque nous modifions l'index, et il ne correspond pas à l'index précédent.

Exemple # 02

Nous modifions maintenant les valeurs d'index de colonne du «Value_DF», que nous avons précédemment créées dans l'exemple 1. Après avoir imprimé le «Value_DF», nous avons mis la variable «colonne» et ajouté certaines valeurs. Nous ajoutons "A_1, B_1, C_1, D_1 et E_1". Maintenant, nous voulons ajuster ces valeurs comme index des colonnes, donc, pour cela, nous utilisons la méthode "Reindex ()" et nous plaçons le nom de la variable "colonne" dans laquelle les nouvelles valeurs d'index de colonne sont stockées et Définissez également «l'axe» sur «colonnes», il mettra donc à jour l'index de l'axe de la colonne. Nous mettons la méthode «reindex ()» dans le «print ()», donc il rendra également sur le terminal.


Comme nous avons utilisé la méthode «Reindex ()», les valeurs d'index de colonne qui sont présentes dans le premier DataFrame sont mises à jour et de nouvelles valeurs sont ajoutées dans le DataFrame mis à jour. Vous pouvez également noter que toutes les valeurs du dataframe sont converties en «nan» car les deux valeurs d'index des colonnes sont différentes.

Exemple # 03

Le «Programming_data» dans ce code contient «p_languages», où nous avons ajouté «JavaScript, CSS, Web Engineering, OOP, C #, AI, Java et JavaScript». Ensuite, nous avons des «heures» dans lesquelles nous placons «4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs et 6_hrs». Après cela, le «p_code» est entré, et nous insérons «11523, 12423, 12321, 11456, 11454, 12267, 13106 et 14123». Nous ajoutons la variable "p_index" et mettons "pro_a, pro_b, pro_c, pro_d, pro_e, pro_f, pro_g et pro_h".

Ces valeurs seront utilisées comme valeurs d'index des lignes. Nous modifions le "programming_data" dans le dataframe "programming_df". Nous ajoutons également le «p_index» à cette dataframe en utilisant la méthode «index». Nous mettons «programming_df» puis la méthode «index» et assignons le «p_index» à cela. Maintenant, les valeurs d'index ci-dessus sont ajoutées comme les valeurs d'index des lignes au dataframe. Nous imprimons également le «programming_df».

Après cela, nous ajoutons de nouvelles valeurs d'index dans la variable "new_index", et ce sont "p_1, p_2, p_3, p_4, p_5, p_6, p_7 et p_8". Comme nous voulons mettre à jour les valeurs d'index des lignes, nous utilisons la méthode "Reindex ()" et mettons "new_index" comme paramètre de cette fonction et stockons également le dataframe mis à jour dans le "newProgramming_df" et placons le "newProgramming_df" dans " print () ”pour afficher.


Les valeurs d'index sont mises à jour, et nous pouvons également dire que nous avons rendu le DataFrame que nous avons créé. Toutes les valeurs du dataframe sont également converties en «nan» car les deux valeurs d'index sont différentes.

Exemple # 04

Nous modifions actuellement les valeurs d'index «programming_df» des colonnes, que nous avons déjà développées dans l'exemple 3. Nous plaçons la variable «colonne» et y insérons de nouvelles valeurs. Le «p_code, p_languages, heures et nouveaux» sont ajoutés à la variable «colonne». Ensuite, nous utilisons à nouveau la méthode «Reindex ()» dans laquelle nous définissons la variable «colonne», qui mettra à jour les valeurs d'index de colonne précédentes et ajoutera ces nouvelles valeurs d'index de colonne à DataFrame.

Ici, vous pouvez noter que les nouvelles valeurs que nous avons ajoutées dans la «colonne» sont les mêmes que nous avons ajoutées dans le dataframe ci-dessus, mais la séquence est différente, elle modifiera donc la séquence des colonnes et ajustera toutes les colonnes comme nous mentionné dans la variable «colonne». De plus, nous ajoutons une valeur d'index de plus qui n'est pas présente dans le DataFrame ci-dessus, qui est «nouveau» ici, donc les valeurs «nan» apparaîtront dans cette colonne.


La séquence des colonnes est modifiée ici, et toutes les valeurs apparaissent telles qu'elles sont présentes dans les colonnes de DataFrame d'origine et la «nouvelle» colonne dans le DataFrame mise à jour contient toutes les valeurs «nan» car cette colonne n'est pas présente dans le DataFrame d'origine.

Conclusion

Nous avons présenté ce tutoriel qui nous aide à comprendre la notion «Pandas Reindex» en détail. Nous avons discuté de la façon dont nous pouvons réindexer une colonne de DataFrame ainsi que les valeurs d'index de la ligne. Nous avons expliqué que la fonction «reindex ()» des «pandas» est utilisée pour ce faire. Nous avons fait différents exemples dans lesquels nous avons modifié les valeurs d'index des lignes de DataFrame et également les valeurs d'index de l'index de colonne du DataFrame. Nous avons rendu les résultats de tous les codes que nous avons faits ici dans ce tutoriel et les avons également expliqués en profondeur.