Pandas obtient l'index

Pandas obtient l'index
«Trouver les indices de ligne est nécessaire, ce qui est crucial pour l'ingénierie des fonctionnalités. Ces capacités peuvent vous aider à éliminer les valeurs aberrantes ou les nombres aberrants à partir d'un dataframe. Un outil vital pour obtenir des lignes spécifiques de lignes ou de colonnes du Pandas Dataframe est appelée un index Pandas. Il est responsable de la mise en place des données pour un accès rapide et une organisation. Un autre nom pour l'index est la sélection des sous-ensembles. La valeur d'index particulière est appelée étiquette. Les valeurs d'index sont écrites en gras. Nous pourrions être tenus de récupérer les noms de ligne ou d'index lors de l'examen des ensembles de données réels, qui sont souvent très importants pour effectuer des opérations spécifiques. Nous montrerons comment extraire les index des Pandas Dataframes dans cet article."

Comment obtenir les index de la dataframe dans Pandas?

En utilisant diverses fonctions et propriétés, il existe plusieurs façons de récupérer les index de la dataframe dans Pandas. Nous expliquerons comment extraire les index de données de données en utilisant certaines techniques différentes dans les exemples suivants.

Tout d'abord, nous verrons le dataframe.propriété index. La propriété d'index d'un Pandas DataFrame est utilisée pour obtenir l'index de ligne. L'étiquette de ligne de DataFrame est renvoyée en tant qu'objet par le DataFrame.fonction d'index.

Exemple n ° 1: obtenir les index en itérant les index du DataFrame

Pour extraire l'index, créons d'abord un dataframe afin que nous puissions itérer à travers ses indices de ligne. Nous devons d'abord charger le module Pandas en l'important pour utiliser ses fonctionnalités avant de créer le DataFrame. Nous allons créer notre DataFrame à l'aide du PD.Méthode DataFrame ().

Le dataframe «df» a été créé. Le «PD.La méthode DataFrame () »a pris le dictionnaire Python avec des clés et des valeurs comme argument. La fonction print () est utilisée pour illustrer le dataframe. Dans le DataFrame «DF», nous avons trois colonnes, «COL1», «COL2» et «COL3», stockant les valeurs (3, 4, 5, 6, 7, 8, 9), (9, 8, 7 , 6, 5, 4, 3) et (1, 3, 5, 7, 8, 0, 11). Le constructeur Python crée un index de ligne entier par défaut sur le côté gauche de chaque ligne (commence à partir de 0). Maintenant, itérasez-le via les index pour obtenir les index du DataFrame à l'aide du DataFrame.propriété index.

La propriété d'index a réussi à récupérer les index de la dataframe. Comme vous pouvez le voir, les indices de ligne de notre dataframe ont commencé à 0 et se sont terminés à 6.

Exemple n ° 2: obtenir les index en tant qu'objet de liste

Tout d'abord, nous créerons une dataframe avec des index personnalisés. Nous spécifierons les étiquettes non numériques pour les index de ligne dans notre DataFrame.

On peut voir que l'index de ligne n'est plus un index entier car nous avons spécifié la liste des étiquettes en tant que [«R1», «R2», «R3», «R4», «R5», «R6», «R7 »] Au paramètre d'index de PD.Fonction DataFrame (). Nous avons créé trois colonnes «C1», «C2» et C3 »stockant les données factices (33, 45, 12, 78, 34, 86, 23), (26, 37, 76, 25, 97, 53, 31) et (17, 74, 95, 63, 54, 56, 19) respectivement. Maintenant, nous utiliserons la fonction List () pour obtenir la liste des étiquettes d'indexes. Un objet de liste peut être créé à l'aide de la fonction list (). Une collection modifiable ordonnée est appelée un objet de liste.

À l'intérieur de la fonction list (), nous avons utilisé la propriété d'index pour récupérer les index du dataframe. La fonction List () les stocke ensuite comme les éléments d'un objet de liste.

Exemple # 3: obtenir le tableau de l'index en utilisant l'index.Méthode valeurs ()

Dans cet exemple, l'index.La méthode des valeurs sera utilisée pour récupérer les index du dataframe. Un ensemble commandant dépensable implémenté par le ndarray immuable appelé index pandas. Les noms d'axe pour tous les objets des pandas sont stockés dans cet objet de base. L'index.Valeurs Attribut de Pandas Renvoie un tableau contenant les données dans l'objet index spécifié.

Nous avons créé l'index personnalisé en définissant une liste de label ['i', 'ii', 'iii', 'iv', 'v', 'vi', 'vii'] dans le paramètre d'index. Il y a trois colonnes dans notre dataframe. La colonne «x» est de stockage des valeurs ('a', 'b', 'c', 'd', 'e', ​​'f', 'g'), colonne «y» contenant les valeurs de données ('h' ' , 'i', 'j', 'k', 'l', 'm', 'n'), et la colonne "z" ayant les valeurs ('o', 'p', 'q', 'r ',' s ',' t ',' u '). Maintenant, nous allons utiliser l'index.Méthode de valeurs pour obtenir les index du «DF» de Data.

Nous pouvons également utiliser la fonction tolist () avec l'index.Méthode des valeurs pour récupérer les index du dataframe.

Un tableau spécifié peut être transformé en un objet de liste régulière avec les mêmes valeurs, éléments ou éléments en utilisant la fonction Tolist ().

Exemple n ° 4: obtenir les index en utilisant des méthodes Query () et Tolist ()

Cette technique nous permet de récupérer uniquement les index d'objets Pandas DataFrame spécifiques qui répondent à certains critères. En utilisant le «PD.Méthode DataFrame () »et la méthode Query () des Pandas, un Pandas DataFrame sera créé dans cette méthode. L'application de la méthode Query () à un dataframe et la transmet une condition le fait renvoyer un dataframe qui ne contient que les lignes qui correspondent aux critères / remplissent la condition. Ensuite, nous utiliserons la méthode Tolist () avec l'attribut d'index, qui renverra une liste contenant les valeurs d'index du DataFrame. Examinons le code Python utilisé pour accomplir cette technique pratique pour récupérer les index de l'objet DataFrame qui remplissent les conditions spécifiées.

Nous avons créé un DataFrame ayant des étiquettes d'index comme ['01', '02', '03', '04', '05', '06']. Les étiquettes des colonnes de DataFrame sont spécifiées comme «nom», «âge» et «hauteur» avec des valeurs («Alexa», «Mark», «Ryan», «Bob», «Tom», «Joe»), (21 , 20, 21, 24, 22, 23) et (5.4, 5.8, 5.7, 6.1, 5.9, 6.2) respectivement.

À l'intérieur de la fonction Query (), nous avons spécifié une condition pour récupérer ces lignes où la valeur dans la colonne «hauteur» est supérieure à 5.7. Ensuite, nous avons utilisé l'attribut d'index pour extraire les index des lignes récupérées, tandis que la fonction tolist () a converti les index retournés en une liste I.e. ['02', '04', '05', '06].

Exemple # 5: Obtention de la valeur d'index de la colonne par get_loc () Fonction avec des colonnes Attribut

Dans les exemples précédents, nous avons vu comment obtenir des index des lignes de données de données, mais maintenant nous récupérerons la valeur d'index de colonne d'une colonne spécifique à l'aide de la méthode get_loc () avec l'attribut colonnes. La valeur d'index d'un certain nom de colonne au sein d'un pandas dataframe sera renvoyée dans cet exemple. L'attribut des colonnes et la fonction get_loc () seront tous deux utilisés pour cette tâche. Le nom de variable que nous aimons sélectionner sera spécifié en tant que valeur de chaîne dans la méthode get loc.

En utilisant un dictionnaire Python à l'intérieur du PD.Fonction DataFrame (), nous avons créé notre DataFrame. On peut observer qu'il y a 5 colonnes dans notre dataframe ayant des noms «A», «B», «C», «D» et «E». Utilisons l'attribut de colonne avec la fonction get_loc () pour obtenir la valeur d'index de la colonne «D».

Pour cela, nous mettrons le nom de la colonne, je.e., «D», en tant que chaîne à l'intérieur de la fonction get_loc ().

La colonne «D» est placée à la valeur de l'index 3.

Conclusion

Dans ce tutoriel, nous avons essayé d'enseigner comment vous pouvez obtenir les index du Pandas DataFrame dans Python. Nous avons discuté des index dans les pandas et comment vous pouvez les récupérer en utilisant différentes fonctions et attributs. Nous avons implémenté différents exemples pour vous apprendre à obtenir les index en itérant les index du DataFrame, en utilisant l'attribut d'index, en utilisant des méthodes Query () et Tolist () et en utilisant la fonction get_loc () avec l'attribut Colonnes.