Index de set Pandas

Index de set Pandas
La fonction «set_index» de Pandas est utilisée pour définir le DataFrame ou la série comme la clé d'un dataframe. La fonction «set_index ()» de Pandas crée l'index de dataframe en tirant parti des colonnes préexistantes. L'indice peut remplacer ou développer l'indice actuel.

La syntaxe de cette méthode est la suivante:

Le premier paramètre «touches» classe le nom de la colonne que nous voulons définir comme index. L'attribut «Ajouter» ajoute la colonne fournie lorsque la valeur de l'index est définie sur true. Le paramètre «Drop» laisse tomber les colonnes. Sa valeur par défaut est «vrai». Le «InPlace», lorsqu'il est valorisé comme «vrai», apporte les modifications dans le dataframe d'origine et n'en crée aucune copie. Le dernier paramètre «Verify_integrity» vérifie la duplication du nouvel index de colonne.

Nous apprendrons l'exécution pratique de cette méthode à travers diverses techniques de cet article.

Exemple # 1: Utilisation de la méthode set_index () pour modifier la colonne d'index

Cette démonstration va développer l'utilisation des pandas «df.set_index () ”Méthode pour modifier la liste d'index par défaut dans un dataframe vers une colonne d'index définie par l'utilisateur.

L'outil «Spyder» est lancé pour commencer à travailler sur la compilation et l'exécution du script. Nous avons d'abord chargé les bibliothèques requises dans le programme. Le package dont nous avions besoin ici est les «pandas». Donc, nous l'avons importé comme «PD».

Nous avons généré une dataframe en utilisant la méthode Pandas «PD.Trame de données()". Vous avez le choix d'importer un fichier CSV ou de créer un dataframe à l'aide du «PD.Méthode DataFrame () ». Le «PD.Fonction DataFrame () ”dans l'invoqué avec 4 colonnes« EMP_NAM »,« Expérience »,« Revenu »et« Bonus ». Chaque colonne stocke 11 valeurs.

Nous avons des valeurs pour la colonne "emp_name" comme "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", et «k». Les entrées de la colonne «Expérience» sont «5», «2», «17», «21», «9», «20», «11», «32», «23», «14» et "30". La troisième colonne que nous avons est «Revenu» qui stockait ces valeurs «40000», «30000», «100000», «50000», «40000», «70000», «200000», «95000», «60000», «27000» et «98000». La colonne «Bonus» maintient ces valeurs «30000», «40000», «60000», «30000», «86000», «50000», «60000», «95000», «76000», «27000» et et «78000».

Le «PD.La méthode DataFrame () »construira un DataFrame avec ces valeurs fournies. Pour stocker le DataFrame, nous avons créé un objet DataFrame «Enregistrer». Nous l'avons attribué la sortie de l'appel le «PD.Fonction DataFrame () ”. Enfin, le contenu est présenté sur la console en exerçant une fonction «print ()» de Python.

Lorsque nous exécutons le programme Python en cliquant sur l'option «Exécuter le fichier», nous voyons un DataFrame avec 4 colonnes et 11 lignes. Ce dataframe a été affiché avec la liste d'index par défaut qui démarre à partir de «0» et monte à la longueur du DataFrame.

Vous devrez peut-être modifier la colonne d'index du dataframe parfois. Ici, nous apprendrons à modifier la colonne d'index dans un dataframe en utilisant le «DF.set_index () ”Méthode. En utilisant cette méthode, nous modifierons la colonne d'index par défaut avec une colonne existante dans le dataframe fourni.

Nous avons invoqué le «DF.set_index () ”Méthode. Le nom de DataFrame est fourni comme «enregistrement» avec la fonction «set_index ()». Entre les parenthèses de cette fonction, nous avons fourni le nom de la colonne que nous devons définir en tant que colonne d'index dans le résultat de données résultant. La colonne que nous avons mentionnée est «EMP_NAME». Ainsi, la méthode "set_index ()" examinera le "enregistrement" DataFrame, trouvera la colonne intitulée "EMP_NAM. Le résultat est enregistré dans la variable «réglage». À l'aide de la fonction «print ()», nous l'avons affichée à l'écran.

La colonne d'index de la sortie de Dataframe est passée de la liste par défaut vers le «EMP_NAME». La sortie résultante est fournie dans l'image ci-dessous.

Exemple # 2: Utilisation de la méthode set_index () pour modifier l'index en colonnes d'index multiples

Lors de la modification de l'index du DataFrame, nous pouvons définir encore plus d'une colonne comme les index du DataFrame. Explorons le concept à travers le programme Python.

Pour cette illustration, nous avons utilisé le dataframe créé dans l'exemple précédent. Le «DF.set_index () ”La méthode est invoquée. Nous avons appelé la fonction avec les paramètres suivants: «Keys», «Inplace», «Ajouter» et «Drop». Les clés de l'indice que nous avons fournies ici sont «EMP_NAME» et «Revenu». Deux colonnes ont été sélectionnées car nous devons définir plus d'une colonne comme index dans le dataframe. Le paramètre «en place» est défini «vrai», ce qui signifie que les chances seront faites dans la réelle Dataframe sans en créer aucune copie.

Nous avons défini la valeur «True» pour l'attribut «APPEND». Garder le vrai va ajouter les nouvelles colonnes d'index avec la colonne d'index déjà existante ou par défaut. La dernière propriété que nous avons utilisée ici est «Drop» avec la valeur «False». Ainsi, il ne supprimera pas les colonnes que nous avons définies pour l'index à partir de DataFrame. Comme les modifications sont préférées à être apportées dans le dataframe réel, nous n'avons donc pas besoin de créer un objet. Imprimer simplement le DataFrame réel après la définition de l'index nous affichera les modifications. Nous avons utilisé la fonction «print ()» pour montrer le résultat.

Notre DataFrame réelle mise à jour s'affiche qui a une colonne d'indice par défaut ainsi que les deux colonnes d'index nouvellement spécifiées comme «EMP_NAME» et «Revenu».

Exemple # 3: Utilisation de la méthode set_index () pour modifier la colonne d'index avec la colonne de valeur de flotteur

Nous pouvons également modifier la colonne d'index par défaut et définir une colonne flottante comme indexeur dans le dataframe. Nous verrons sa mise en œuvre pratique ici.

Nous devons d'abord créer une colonne avec des valeurs flottantes dans le dataframe. Le dataframe de la première instance est à nouveau utilisé, sauf que les valeurs de la colonne «bonus» sont maintenant flottantes. Nous avons fourni ces valeurs pour la colonne «bonus»: «30.87 ”,« 40.16 ”,« 60.98 ”,« 30.87 ”,« 86.32 ”,« 50.92 ”,« 60.11 ”,« 95.12 ”,« 76.24 ”,« 27.35 ”et« 78.52 ”. Ensuite, nous avons imprimé la fonction DataFrame mise à jour à l'aide de la fonction «print ()».

Le dataframe avec la colonne «bonus» mise à jour est exposée.

Nous avons invoqué le «DF.set_index () »Méthode et définissez la colonne de clé d'index comme« bonus ». Le paramètre «InPlace» est apprécié comme «vrai». Ainsi, les modifications seront apportées dans la réelle Dataframe.

La colonne de flotteur est définie comme la colonne d'index dans le dataframe qui peut être vu dans l'image ci-dessous.

Exemple n ° 4: Utilisation de la méthode set_index () pour définir le multiindex dans la copie du dataframe

Nous pouvons définir MultiIndex dans le DataFrame en utilisant la méthode "set_index ()". La méthode «set_index» est invoquée avec le nom du «enregistrement» de DataFrame «Enregistrement». Dans les accolades rondes, nous avons initialisé l'opérateur d'indice et défini les noms des colonnes comme «EMP_NAME» et «Expérience». Ici, nous avons préféré exécuter la fonction avec les paramètres par défaut où «InPlace» est défini comme «faux». Les manipulations seront réalisées dans la copie du DataFrame.

Pour stocker cette copie DataFrame, nous avons créé une variable «Multi_index». Enfin, nous avons montré le contenu de la copie du DataFrame stocké dans la variable «Multi_index» en utilisant la fonction «print ()».

Cela nous donne le résultat suivant:

Conclusion

Dans cette session d'apprentissage, nous avons démontré la nécessité de modifier la colonne d'index dans un dataframe. Pandas a fourni la méthode «DF.set_index ”est utilisé dans ce tutoriel pour atteindre le résultat souhaité. Nous avons fourni la syntaxe pour utiliser cette fonction avec une brève description des paramètres. Toutes les techniques pour exercer la fonction «set_index ()» sont pratiquement implémentées sur l'outil Spyder. Nous pouvons utiliser la méthode en fonction de notre besoin de savoir si nous souhaitons définir une seule colonne en tant que clé d'index ou plusieurs colonnes.