Pandas Multiindex

Pandas Multiindex
Lorsque nous parlons des bibliothèques open source de «python», alors «pandas» est l'un d'eux. Nous utilisons cette bibliothèque lorsque nous devons manipuler et analyser les données. Nous pouvons utiliser les modules «pandas» pour créer les différentes séries ou dataframe. Parfois, nous devons ajuster les multiples colonnes comme les colonnes d'index dans le dataframe. «Pandas» fournit une méthode «multiindex» pour créer plus d'un index. La méthode «MultiIndex» offre la possibilité de sélectionner les multiples lignes ou colonnes comme index de ce DataFrame. Nous découvrirons les méthodes «multiindex» de ce guide et ferons également des codes où nous utilisons les méthodes «multiindex» de «pandas» pour créer plusieurs index.

Méthodes Pandas Multiindex

«Pandas» fournit de nombreuses méthodes de «multiindex» que nous utilisons pour créer plusieurs index. Ceux-ci sont:

  • Multiindex.de_frame
  • Multiindex.de_product
  • Multiindex.de_arrays
  • Multiindex.de_tuples

Maintenant, nous avançons et utilisons ces méthodes «multiindex» que nous avons mentionnées précédemment dans le code «pandas» ici.

Exemple 1:

Le premier code de ce guide est donné ici. Nous avons fait tous les codes dont nous discuterons dans ce guide dans l'outil «Spyder». Chaque fois que nous voulons développer le code «pandas», nous devons importer des modules «pandas». Nous pouvons les importer en utilisant simplement le mot-clé «importer» et écrire les «pandas en tant que PD». Maintenant, dans ce code, nous obtenons les fonctions de «pandas» en plaçant «PD». Nous créons des tableaux ici. Le premier tableau est nommé «Raw_Names» et il contient «Smith, James, Bromley, Peter et Samuel». Le tableau suivant est nommé «Raw_ages» dans lequel nous stockons les valeurs «10, 11, 15, 12 et 13». Le dernier tableau que nous avons est le «Raw_marks» qui contient les «90, 92, 83, 74 et 88».

Après avoir créé ces tableaux, nous utilisons ici la méthode «multiindex» qui est le «multiindex.From_Arrays () ”Méthode. Nous plaçons le nom des trois tableaux de cette méthode, ce qui signifie que ces trois tableaux sont combinés de sorte que les composants de chaque tableau peuvent être utilisés pour créer les index multiples. Dans les noms, nous passons les «noms, âges et marques». Maintenant, nous affichons le résultat du code mentionné ici en utilisant la fonction «print ()».

En frappant le «Shift + Entrée», nous obtenons ce résultat. Lorsque le code est sans erreur, le résultat suivant est rendu à l'écran. Il affiche le multiindex ici que nous avons créé dans ce code:

Exemple 2:

Dans ce code, nous créons le dataframe. Nous créons ici la liste «Worker_Information». Nous ajoutons le «nom» qui apparaît comme le nom de la colonne lorsque nous les convertissons dans DataFrame et insérez «William, Timmy, James, Alexander et Graham». Le «travail» contient «l'ingénieur logiciel, le testeur de logiciel, le joueur, le vendeur et l'enseignant». Ensuite, nous avons le «mensuel_salary» où nous mettons le salaire des travailleurs «1500 $, 1200 $, 1100 $, 1300 $ et 1500 $». Ensuite, nous convertissons cette liste imbriquée dans le dataframe. Nous utilisons le «PD.DataFrame () »ici pour faire cela.

Ensuite, le «print ()» nous aide à rendre ce DataFrame. Maintenant, nous avons ici une variable nommée «Résultat» et utilisons le «Multiindex.From_Frame () ”Méthode pour créer toutes les colonnes comme index. Il crée un multi-index de ce DataFrame donné à l'aide de cette méthode. Après cela, nous ajoutons cette variable dans le «print ()», donc elle rend après l'exécution.

Ici, le DataFrame est vu en premier dans ce résultat et le multiindex est affiché avec les valeurs suivantes. Nous obtenons ces multiples index en utilisant le «Multiindex.From_Frame () »Méthode.

Exemple 3:

Nous utilisons à nouveau le «Worker_DF» dans cet exemple. Cette fois, nous ajoutons une nouvelle colonne à ce DataFrame qui est "W_NO". Nous ajoutons également des données à cette colonne qui est «W101, W102, W103, W104 et W105». Maintenant, nous utilisons une autre méthode ici pour créer les multiples index de ce DataFrame. Nous utilisons le «DF.Set_index ”Méthode ici dans laquelle nous mettons les noms de deux colonnes qui sont« w_no et nom ». Ensuite, nous ajoutons le «sur place» et «ajouter» à la fois à «vrai» et à «Drop» à «False». Donc, il ne laissera pas tomber les colonnes.

Ces colonnes apparaissent deux fois dans le dataframe. L'index, ainsi que la colonne, apparaît ici. Ensuite, nous appliquons le «print ()» au «worker_df». Le «Worker_DF» est rendu. Maintenant, nous affichons également les index séparément en mettant «Worker_DF.Index »dans« Print »après avoir affiché le nom de données mis à jour dans lequel nous définissons ces index multiples.

Dans le premier DataFrame, seul l'index par défaut apparaît et il n'y a pas d'autre colonne d'index dans ce DataFrame. Mais le dataframe suivant montre plusieurs index. Vous pouvez facilement voir les index «w_no et nom» que nous avons créés dans le code. Ces index ainsi que les valeurs sont affichés séparément à la fin.

Exemple 4:

Nous construisons à nouveau les différents tableaux dans ce code. Le «Callum, Tyler, Chloé, Lewis, Hazel, John et Peter» sont tous répertoriés dans le premier tableau. Le «patient_name» est appelé ici. Le tableau suivant, «patient_age», contient les valeurs «28, 33, 45, 17, 22, 44 et 29». Le dernier tableau est appelé «patient_contact» et il contient les nombres «1001234, 1001235, 1001236, 1001237, 1001238, 1001239 et 1001240».

Ici, nous utilisons la méthode «multiindex» qui est le «multiindex.From_Arrays () ”Fonction après avoir créé ces tableaux. Nous passons ensuite les noms de ces trois tableaux dans le «Multiindex.From_arrays ”pour créer ces tableaux comme les index ici. Nous ajoutons également le «parent, l'âge et le contact» dans les noms. Après cela, nous avons le «print ()» qui nous aide à rendre les données de la variable «patient» où nous stockons les index multiples après avoir appliqué le «multiindex.From_arrays ”Méthode.

Ce résultat montre tous les index que nous avons ajoutés au code. Le nom est également mentionné ici. Tous les tableaux sont définis ici en tant qu'index multiples à l'aide du «Multiindex.From_Arrays () ”Méthode.

Exemple 5:

Maintenant, voici le dernier code de ce guide où nous générons le DataFrame et créons les multiples index de ce DataFrame. Pour créer le DataFrame, nous devons ajouter des données ici. Nous ajoutons toutes les données de la variable «XYZ». Nous ajoutons d'abord le «xyz_name» qui contient «John, Michael, Foster, Samuel, Bromley, Smith et Fuller». Ensuite, nous avons «xyz_codes» et nous avons mis «XYZ23, XYZ24, XYZ25, XYZ26, XYZ27, XYZ28 et XYZ29». Maintenant, vient le «xyz_month» qui contient «Jan, février, mars, avril, mai, juin et juillet». Nous ajoutons ensuite les «xyz_units» dans lesquels nous mettons «20, 14, 19, 46, 35, 20 et 53».

Maintenant, nous créons le «xyz_dataframe» et nous plaçons le «PD.Méthode DataFrame () ”ici qui crée le dataframe des données« xyz ». Ensuite, nous affichons également le "XYZ_DATAFRAME". Maintenant, nous créons les multiples index du dataframe, nous utilisons donc le «multiindex.From_Frame () »Méthode. Cela crée les multiples index de ce DataFrame et les stocke dans la variable "xyz_dataframe1". Cette variable est également placée dans le «print ()» afin que ces index soient affichés sur le terminal.

Il affiche le "xyz_dataframe". Ensuite, il y a les index qui sont créés après avoir appliqué le «Multiindex.From_Frame () »Méthode. Tous les index ainsi que les valeurs et les noms de colonne sont affichés dans ce résultat.

Conclusion

Ce guide est écrit ici pour clarifier le concept du «Multiindex» dans «Pandas». Nous avons discuté des différentes méthodes de «multiindex» que «pandas» fournit. Nous avons également discuté de certains d'entre eux en détail ici. Nous avons appliqué ces méthodes dans les codes «pandas» ici et montré comment les multiples index sont créés dans «Pandas» à l'aide de méthodes «multiindex». Nous avons appliqué ces méthodes aux tableaux et aux données de données et avons expliqué tous ces codes en détail. Nous avons montré le dataframe avant de créer les index multiples et après avoir créé les index multiples en utilisant la méthode multi-index «pandas». Nous avons également affiché les index multiples séparément dans ces codes.