Comment modifier l'index dans les colonnes Pandas
Nous pouvons faire l'une des colonnes dans le DataFrame dans l'index à l'aide de la méthode Pandas set_index. Pour comprendre comment fonctionne la méthode set_index (), regardons sa syntaxe.
Syntaxe pour le dataframe.set_index
Trame de données.set_index (clés, drop = true, append = false, inplace = false, vérifiey_integrity = false)Paramètre
Comme nous l'avons vu dans la syntaxe, nous verrons maintenant comment utiliser la fonction set_index () pour définir ou modifier les index d'une dataframe dans les exemples suivants.
Exemple 1: Définition de l'index du DataFrame à l'aide de set_index ()
Un exemple de dataframe avec certaines lignes et colonnes est créé en premier. Juste un simple DataFrame contenant un enregistrement d'étudiant «factice» est créé ici. Le nom, l'âge, le sujet et les frais sont les quatre colonnes ou variables dans le DataFrame «DF."
Nous avons d'abord importé le module Pandas pour utiliser les fonctionnalités et fonctions fournies par la bibliothèque. Ensuite, un dictionnaire est passé dans les paramètres du PD.DataFrame () fonctionne comme un argument pour créer un «DF» DataFrame.
Observez que sur le côté gauche de la dataframe affichée, il y a un nombre au début de chaque ligne (les nombres de 0 à 6). Ces nombres sont appelés index. Maintenant, nous utilisons la méthode pandas set_index () pour définir l'index du dataframe «df». Pour ce faire, nous devons taper le nom du DataFrame, suivi d'un «point» puis du nom de la méthode qui est «set index ()». Nous utilisons le nom de colonne entre les parenthèses de la fonction set_index ().
La colonne «frais» a remplacé l'indice entier précédent (0 à 6). Nous avons passé la colonne «Fee» à l'intérieur de la fonction set_index () comme un argument pour le définir comme l'indice de ligne de notre DataFrame.
Exemple 2: Définition de l'index du DataFrame à l'aide d'une liste
Nous pouvons également fournir à DataFrame une liste des étiquettes qui peuvent être des chaînes ou des numéros. Nous utilisons la fonction set_index () pour créer un nouvel index dans le DataFrame en utilisant l'objet List. Créons notre DataFrame avec des données factices après l'importation des modules Pandas.
Notre DataFrame est créé avec trois colonnes - «Nom», «Age» et «Country» - Stockage des données factices. Maintenant, en utilisant une liste des étiquettes, un index Python est créé que nous passerons ensuite à DataFrame.Définir index () Fonction comme une entrée.
Nous avons passé une liste contenant les étiquettes des indexes en ligne [«R1», «R2», «R3», «R4», «R5», «R6»] au Pd.Fonction index () et l'a attribuée à la variable «index». La variable est ensuite transmise comme un argument à l'intérieur des parenthèses de la fonction set_index () pour définir les index de DataFrame.
Comme le montre le DataFrame donné, notre liste spécifiée a remplacé l'index par défaut de DataFrame par des étiquettes («R1», «R2», «R3», «R4», «R5», «R6»).
Exemple 3: Définition de l'index de DataFrame à l'aide de plusieurs colonnes
DataFrames dans Python Pandas ayant plus d'une ligne ou d'une colonne comme un index est appelé les data-index. En utilisant le dataframe.Fonction set_index (), nous pouvons définir plusieurs colonnes sous forme d'étiquettes de ligne. Il convient de comprendre que la définition de plus d'un index rend notre dataframe compliquée. L'indice peut être structuré de plusieurs manières. Nous vous montrerons comment définir les différentes colonnes comme un index d'une manière simple. Créons d'abord notre DataFrame.
Notre DataFrame a quatre colonnes - «id», «nom», «cours» et «code».
À partir de ces colonnes, nous décidons quelles colonnes sont appropriées à utiliser comme index de notre dataframe. Après avoir décidé des colonnes appropriées, nous passons une liste avec deux étiquettes à l'intérieur de la fonction set_index ().
Les colonnes «ID» et «Code» sont définies comme les indices de ligne dans le DataFrame. En utilisant les noms de colonne à l'intérieur de la liste et en les transmettant au set_index (), nous avons attribué ces colonnes comme index. La liste [«id», «code»] est adoptée comme l'argument du set_index (). Les colonnes de nom et de région sont les nouveaux index, comme on le voit dans la sortie.
Exemple 4: Définition de l'index du DataFrame à l'aide de la série Python
Un dataframe multi-index peut être créé en attribuant de nouvelles séries à l'aide du «DataFrame.Set_Index () ”Fonction Lorsque nous devons modifier l'index entier existant avec certaines séries Pandas plutôt que les colonnes de DataFrame. Nous créons d'abord un dataframe en passant un dictionnaire à l'intérieur du PD.Fonction DataFrame () pour démontrer comment une série peut être transmise en tant que premier et deuxième niveau de DataFrame.
Maintenant, nous créons une série en passant une liste d'entiers à l'intérieur des parenthèses du PD.Série () Fonction. Nous attribuons cette série à la variable «n».
Comme le montre le DataFrame donné, notre série «N» et «N ** 2» sont définies comme les premiers et les index de deuxième niveau.
Exemple 5: Définition de l'index du DataFrame à l'aide de la plage Python
Disons que nous devons spécifier une série d'entiers comme index de DataFrame afin qu'il puisse commencer à n'importe quel numéro. Par exemple, nous voulons démarrer le numéro d'identification de l'employé DataFrame à 1. Il n'est pas possible d'utiliser le dataframe.fonction set_index () avec une liste de tous les nombres en entrée. La méthode Python Range () peut être utilisée dans cette situation. En utilisant la fonction Range (), nous pouvons créer un index de pandas que nous pouvons ensuite transmettre au dataframe.Définir la fonction index (). Créons un dataframe afin que nous puissions remplacer son ROW_INDEX en utilisant la fonction Range ().
Nous avons créé notre DataFrame avec les colonnes «nom», «rang», «bonus» et «salaire». Maintenant, définissons l'index à l'aide de la fonction Range () à la place de l'index entier par défaut. La méthode Range () renvoie une série de nombres qui commencent à 0 par défaut, augmente de 1 (par défaut) et se termine avant un numéro spécifié.
Nous avons spécifié la plage d'index pour démarrer à 1, augmenter de 1 et terminer avant 6. Après avoir spécifié la plage d'index, nous avons passé la variable «Index» dans la fonction set_index () comme une entrée pour définir l'index de ligne de notre DataFrame.
Conclusion
Dans ce didacticiel, nous avons discuté des index d'une dataframe et de la façon de définir les nouveaux index dans un dataframe existant. Nous avons vu que le constructeur Python crée un index entier pour chaque ligne par défaut, mais il peut être modifié en utilisant la fonction set_index (). Nous avons vu la syntaxe de la fonction set_index () dans ce didacticiel et implémenté les multiples exemples pour vous apprendre à définir l'index de ligne du DataFrame à l'aide de listes, de séries et de colonnes en pandas.