Pandas obtient des valeurs d'index

Pandas obtient des valeurs d'index

Les index des lignes sont appelés index de données de données, tandis que les index des colonnes sont appelés noms de colonnes générales. Les index sont principalement utilisés pour récupérer les données ou stocker les données dans le dataframe. Cependant, nous pouvons également récupérer l'indice lui-même en utilisant le .propriété index. Dans ce didacticiel, nous vous apprendrons comment obtenir un index en tant qu'objet de liste, comment convertir l'index en une colonne DataFrame pour la récupérer, et comment vous pouvez obtenir l'index en utilisant plusieurs conditions et la propriété d'index de Pandas.

Comment obtenir des valeurs d'index dans les pandas?

Le dataframe.La propriété d'index peut être utilisée pour obtenir un index d'un Pandas Dataframe. Un objet de liste d'index contenant l'index de DataFrame est renvoyé en utilisant le dataframe.propriété index.

Syntaxe:

pandas.Index (data = non, dType = Aucun, copy = false, name = aucun, tupleize_cols = true, ** kwargs)

:

données: semblable à un tableau (unidimensionnel)

dtype: Numpy Dtype. C'est «objet» par défaut. Nous choisirons le DTYPE qui convient aux données si DTYPE est «aucun». Si un dtype est spécifié et sûr, le DTYPE sera contraint. Sinon, un avertissement sera affiché.

copie: Bool. Une copie du ndarray donné sera faite.

nom: objet. Le nom qui est stocké dans l'index.

Tupleize_cols: Bool. Par défaut, c'est vrai. Si c'est vrai, il essaiera de créer un multiindex.

Les méthodes pour obtenir l'index de DataFrame sont démontrées dans les exemples ci-dessous.

Exemple n ° 01: Extraire l'index de ligne DataFrame à l'aide de la propriété NDEX

Créons d'abord un dataframe, avec plusieurs lignes afin que nous puissions démontrer comment obtenir son index de ligne à l'aide de la propriété d'index Pandas. Avant de créer le DataFrame, nous importerons le module Pandas pour utiliser ses fonctions.

Importer des pandas en tant que PD
Student_info = [('Tyson', 23),
('Jack', 25),
('Bruce', 25),
('Peter', 24),
('Nick', 21),
('Haris', 26),
('Randy', 25)
]]
df = pd.DataFrame (Student_info, Columns = ['Name', 'Age'])

En utilisant une liste à l'intérieur du PD.Fonction DataFrame (), nous avons créé notre DataFrame. Il y a deux colonnes dans notre dataframe: nom et âge. La colonne «Nom» est en train de stocker les noms de certaines personnes aléatoires («Tyson», «Jack», «Bruce», «Peter», «Nick», «Haris», «Randy»). Tandis que la colonne «Âge» est composée de l'âge de chaque personne (23, 25, 25, 24, 21, 26, 25). Au début de chaque ligne, il y a une valeur d'index pour chaque ligne créée par le constructeur Pandas par défaut. Maintenant, nous utiliserons la propriété d'index pour extraire cette colonne d'index.

df.indice

La sortie montre que les lignes commencent à 0, incrément de 1 et se terminant sur l'index avant 7.

Pour imprimer chaque valeur d'index, nous pouvons utiliser un itérateur et à l'intérieur ou la fonction print ().

i = df.indice
pour x dans i:
Imprimer (x)

Maintenant, nous avons imprimé toutes les valeurs de l'index 0 à 7.

Exemple n ° 02: Extraire l'index de ligne DataFrame à l'aide d'une condition

Les valeurs d'index peuvent être récupérées en spécifiant une condition. La propriété d'index va récupérer les valeurs d'index du dataframe qui satisfont la condition spécifiée. Ensuite, nous utiliserons la fonction Tolist () pour renvoyer les valeurs récupérées comme une liste. Utilisation du PD.Fonction DataFrame (), créons d'abord notre DataFrame.

Importer des pandas en tant que PD
df = pd.Trame de données(
'item': ['a', 'b', 'c', 'd', 'e', ​​'f', 'g', 'h'],
«Prix»: [100, 200,150, 100, 200, 320, 100, 100],
'code': ['q', 'w', 'e', ​​'r', 't', 'y', 'u', 'i']
)

En utilisant un dictionnaire Python à l'intérieur du PD.Fonction DataFrame (), nous avons créé un DataFrame. Notre DataFrame se compose de trois colonnes et 8 lignes de 0 à 7. La colonne «Items» stockage les valeurs de données sous forme de chaîne («A», «B», «C», «D», «E», «F», «G», «H»). Le «prix» de la colonne contient les valeurs numériques représentant la pièce de chaque élément (100, 200, 150, 100, 200, 320, 100, 100). Le code de colonne ayant les valeurs de données ('q', 'w', 'e', ​​'r', 't', 'y', 'u', "). Maintenant, récupérons les valeurs d'index en utilisant le script ci-dessous.

i = df.indice
index = df ["prix"] == 100
résultat = i [index]
résultat.lister()

À l'aide de la propriété d'index, nous avons récupéré les index de DataFrame «DF». Ensuite, nous avons spécifié une condition pour extraire des données où les valeurs dans la colonne de prix sont égales à 100. Après avoir obtenu les données, nous avons récupéré les valeurs d'index des lignes qui satisfont la condition spécifiée. En fin de compte, la fonction tolist () est utilisée pour transformer la sortie en un objet de liste. La fonction a récupéré une liste avec quatre valeurs d'index [0, 3, 6, 7].

Exemple # 03: Extraire l'index de la colonne DataFrame à l'aide de la fonction get_loc ()

Nous avons vu comment récupérer les valeurs des index de lignes de Dataframe. Cependant, nous pouvons également récupérer les valeurs des index de colonnes d'un Dataframe. Pour obtenir la valeur d'index de toute colonne de DataFrame, la fonction get loc () peut être utilisée. Pour trouver l'index, nous fournissons simplement l'étiquette de colonne à la fonction get_loc (). Créons un dataframe composé de plus d'une colonne afin que nous puissions récupérer son emplacement d'index ou sa valeur d'index.

Importer des pandas en tant que PD
df = pd.Trame de données(
«Classe»: [«A», «A», «B», «B», «C», «C», «D», «D»],
«membres»: [5, 4, 5, 5, 4, 6, 4, 4],
«Salaire»: [30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000],
«dépenses»: [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000]
)

Dans notre DataFrame, nous avons créé quatre colonnes: classe, membres, salaire et dépenses. La colonne de classe est de stocker les valeurs de données ('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'). Les membres de la colonne contient des valeurs (5, 4, 5, 5, 4, 6, 4, 4), tandis que le salaire et les dépenses de la colonne contient les valeurs de données numériques (30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000 ) et (12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000), respectivement. Supposons que nous devons trouver la valeur d'index du salaire de la colonne:

df.Colonnes.get_loc ("salaire")

La fonction a récupéré l'index de la colonne spécifiée, 2.

Exemple # 04: Extraire les valeurs d'index de ligne spécifiées à l'aide de la fonction get_loc ()

Nous pouvons également récupérer l'emplacement d'index des index de ligne à l'aide de la fonction get_loc () si les étiquettes pour les index de ligne sont spécifiées. Nous pouvons spécifier les étiquettes à notre index de ligne en utilisant une liste contenant des noms pour chaque valeur de l'index de ligne. Ajoutons les étiquettes d'index au dataframe que nous avons créé dans l'exemple # 3.

Importer des pandas en tant que PD
df = pd.Trame de données(
«Classe»: [«A», «A», «B», «B», «C», «E», «D», «D»],
«membres»: [5, 4, 5, 5, 4, 6, 4, 4],
«Salaire»: [30000, 28000, 32000, 31000, 30000, 26008, 27000, 28000],
«dépenses»: [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000],
index = ['r1', 'r2', 'r3', 'r4', 'r5', 'r6', 'r7', 'r'])

À l'intérieur de PD.Trame de données() fonction, nous avons spécifié le paramètre d'index comme une liste contenant des étiquettes de R1 à R8. Les étiquettes 'R1', 'R2', 'R3', 'R4', 'R5', 'R6', 'R7' et 'R8' ont remplacé l'indice entier par défaut de DataFrame. Maintenant, récupérons l'emplacement de l'index pour une étiquette spécifique.

Imprimer (DF.indice.get_loc ("r5"))

Tout d'abord, la propriété d'index est appliquée à la dataframe pour obtenir les index. Alors, get_loc () La fonction est appliquée pour extraire la position d'index de l'étiquette d'index spécifiée de la ligne.

Exemple # 05: Extraire les valeurs d'index de ligne à l'aide de la fonction Numpy Where ():

Nous pouvons également obtenir les valeurs d'index en spécifiant une condition à l'intérieur du où() fonction de Numpy. Créons d'abord un dataframe, nous importerons les pandas ainsi que la bibliothèque Numpy pour utiliser ses fonctions.

Importer des pandas en tant que PD
Importer Numpy comme NP
df = pd.Trame de données(
'id': ['001', '002', '003', '004', '005', '006', '007', '008'],
«Prix»: [100, 150, 130, 200, 120, 170, 120, 140],
«Remise»: [30, 40, 10, 20, 60, 10, 30, 60])

Après l'importation des bibliothèques requises, nous avons créé notre DataFrame. Dans notre DataFrame, nous avons trois colonnes (ID, prix et réduction). L'ID des colonnes, le prix et le rabais stocke les valeurs de données ('001', '002', '003', '004', '005', '006', '007', '008'), (100, 150 , 130, 200, 120, 170, 120, 140), et (30, 40, 10, 20, 60, 10, 30, 60), respectivement. Maintenant, trouvons la valeur de l'indice de ligne à l'aide du où() fonction à l'intérieur de la fonction list ().

liste (NP.où (df ["remise"]> 30))
[Array ([1, 4, 7], dtype = int64)]

Nous avons spécifié une condition à l'intérieur de la fonction où () pour obtenir les lignes où la valeur dans la colonne «remise» est supérieure à 30. Pour créer une liste à partir des valeurs retournées, nous avons utilisé la méthode List ().

Conclusion

Cet article a couvert comment récupérer les valeurs d'index de dataframe dans les pandas. Nous avons utilisé différentes fonctions pour récupérer l'indice de ligne et de colonne du dataframe. Nous avons mis en œuvre plusieurs exemples pour vous apprendre à extraire l'index de ligne DataFrame à l'aide de la propriété d'index, en utilisant les conditions et en utilisant la fonction get_loc (). De plus, nous avons discuté de la façon d'obtenir des valeurs d'index de colonne à l'aide de la fonction get_loc ().