Pandas Dataframe Indexation

Pandas Dataframe Indexation
Dans les pandas, l'indexation implique de choisir des colonnes et des rangées de données spécifiques à partir d'un dataframe. Choisir toutes les lignes et même certaines des colonnes, une partie des lignes et toutes les colonnes, ou certaines des lignes et colonnes est ce que l'indexation implique. La sélection des sous-ensembles est un autre nom pour l'indexation. Lorsque nous construisons un objet Pandas DataFrame dans Python en utilisant le PD.La fonction dataFrame () du module Pandas, une adresse dans la ligne ou les indices de colonne est automatiquement produite pour symboliser chaque élément / point de données à l'intérieur du DataFrame. Cependant, les indices de ligne sont l'index de DataFrame, tandis que les indices de colonne sont simplement appelés colonnes. L'index d'un objet DataFrame Pandas identifie essentiellement certaines lignes. Jetons un coup d'œil à modifier l'objet d'index du panda.

Exemple 1

L'option d'index dans Python peut être utilisée pour définir l'index d'une dataframe lors de sa création. Nous générerons une liste et la transmettons au PD.Paramètre d'index de la méthode DataFrame (). Mettons cela en pratique avec le code python. Nous avons importé le module Pandas ici. Après cela, nous avons fait un dictionnaire et une liste de python. Le dictionnaire a été utilisé pour démarrer le développement de DataFrame. Comme vous pouvez le voir, nous avons utilisé la fonction DataFrame avec le paramètre d'index pour faire de la colonne «RR» l'index.

Importer des pandas en tant que PD
dd = 'name': ['Alex', 'ramen', 'zayn', 'Travis', 'Scott'],
«Marques»: [33, 66, 88, 67, 78],
«City»: [«New York», «Los Angeles», «Chicago», «San Diego», «Dallas»]
RR = [1, 2, 3, 4, 5]
ff = pd.DataFrame (DD, index = RR)
Imprimer (FF)

Voir la sortie dans l'image suivante.

Exemple 2

Dans Python, nous pouvons utiliser diverses méthodes pour fabriquer l'index de toute colonne ou colonne existante d'un objet Pandas Dataframe. Dans ce scénario, nous utiliserons l'argument de l'index de l'index () du module Python Pandas Index (). L'argument InPlace est défini sur False par défaut. Cependant, nous allons définir la valeur de l'informatique sur True dans ce cas. La colonne existante est passée au PD.Définir la méthode index () car le nouvel index remplace l'ancien index de DataFrame. Voyons comment cela fonctionne.

Importer des pandas en tant que PD
dd = 'name': ['Alex', 'ramen', 'zayn', 'Travis', 'Scott'],
'Rollnum': ['1', '2', '3', '4', '5'],
«City»: [«New York», «Los Angeles», «Chicago», «San Diego», «Dallas»]
ff = pd.DataFrame (DD)
print ("\ ninial dataframe:")
Imprimer (FF)
ff = ff.set_index ('rollnum')
print ("\ nfinal dataframe:")
Imprimer (FF)

La sortie est donnée dans la capture d'écran suivante.

Exemple 3

Dans ce cas, nous utiliserons l'argument de dépôt de la fonction Set Index () du module Python Pandas (). Cependant, nous définirons l'argument de dépôt sur False dans ce cas. De sorte que le dataframe ne perd pas la colonne qui a été attribuée comme le nouvel index. Faisons cela en pratique avec le code ci-dessous.

Importer des pandas en tant que PD
dd = 'rollnum': ['1', '2', '3', '4', '5'],
«Nom»: [«Alex», «Ramen», «Zayn», «Travis», «Scott»],
'Marques': [33, 66, 88, 67, 78]
ff = pd.DataFrame (DD)
print ("\ ninial dataframe:")
Imprimer (FF)
ff = ff.set_index ('name', drop = false)
print ("\ nfinal dataframe:")
Imprimer (FF)

Voici le résultat.

Exemple 4

En créant une liste de noms de colonnes de données et en le faisant passer à la fonction Set Index (), nous pouvons définir plusieurs colonnes de l'objet Pandas DataFrame comme son index. En conséquence, l'index est appelé multi-index dans ce scénario.

Importer des pandas en tant que PD
dd = 'rollnum': [1, 2, 3, 4, 5],
«Nom»: [«Alex», «Ramen», «Zayn», «Travis», «Scott»],
«Marques»: [33, 66, 88, 67, 78],
«City»: [«New York», «Los Angeles», «Chicago», «San Diego», «Dallas»]
ff = pd.DataFrame (DD)
print ("\ ninial dataframe:")
Imprimer (FF)
ff = ff.set_index (['rollnum', 'name'])
print ("\ nfinal dataframe:")
Imprimer (FF)

Ici, vous pouvez voir la sortie du code ci-dessus.

Exemple 5

Plusieurs techniques peuvent être utilisées pour définir la position de l'objet Pandas DataFrame à n'importe quel objet Python, comme une liste, une gamme ou même une série. Utilisation du PD.Index (), set index () et range () fonctions, nous pouvons définir l'index de l'objet DataFrame (pandas) dans cette approche. Tout d'abord, nous utiliserons la fonction Range () pour construire une séquence python d'entiers, que nous enverrons ensuite au PD.Fonction index (). Cette méthode produit l'objet index du dataframe. L'objet Retour DataFrame Index est ensuite défini comme le nouvel index de DataFrame à l'aide de la fonction Set Index (). Implémentons ce code.

Importer des pandas en tant que PD
dd = 'rollnum': [1, 2, 3],
«Nom»: [«Alex», «Ramen», «Zayn»],
«Marques»: [33, 66, 88],
«City»: [«New York», «Los Angeles», «Chicago»]
ff = pd.DataFrame (DD)
print ("\ ninial dataframe:")
Imprimer (FF)
my_list = ['i', 'ii', 'iii']
idx = pd.Index (my_list)
ff = ff.set_index (idx)
print ("\ nfinal dataframe:")
Imprimer (FF)

Voir la sortie ci-dessous.

Exemple 6

L'index de l'objet Pandas DataFrame peut être défini à l'aide du set index () et du pd.Méthodes index (). Nous commencerons par créer une liste de python, que nous enverrons ensuite au PD.Fonction index (). Cette fonction donnera un objet index de DataFrame. L'objet Retour DataFrame Index est ensuite défini comme le nouvel index de DataFrame à l'aide de la fonction Set Index ().

Importer des pandas en tant que PD
dd = 'rollnum': [1, 2, 3, 4, 5],
«Nom»: [«Alex», «Ramen», «Zayn», «Travis», «Scott»],
«Marques»: [33, 66, 88, 67, 78],
«City»: [«New York», «Los Angeles», «Chicago», «San Diego», «Dallas»]
ff = pd.DataFrame (DD)
print ("\ ninial dataframe:")
Imprimer (FF)
indx = pd.Index (plage (1, 6, 1))
ff = ff.set_index (INDX)
print ("\ nfinal dataframe:")
Imprimer (FF)

Le résultat est donné dans la capture d'écran ci-jointe.

Exemple 7

Utilisation du PD.Fonctions série () et set index (), nous pouvons définir l'index de l'objet DataFrame des pandas dans la méthode précédente. Générer une liste et la transmettre au PD.La fonction série () renverra une série Pandas qui peut être utilisée comme objet DataFrame Index. La série Pandas résultante est transmise à la méthode Set Index (), qui les définit comme le nouvel index de DataFrame. Voyons le code suivant et comprenons comment cela fonctionne.

Importer des pandas en tant que PD
dd = 'rollnum': [1, 2, 3, 4, 5],
«Nom»: [«Alex», «Ramen», «Zayn», «Travis», «Scott»],
«Marques»: [33, 66, 88, 67, 78],
«City»: [«New York», «Los Angeles», «Chicago», «San Diego», «Dallas»]
ff = pd.DataFrame (DD)
print ("\ ninial dataframe:")
Imprimer (FF)
ser_indx = pd.Série ([5, 4, 3, 2, 1])
ff = ff.set_index (ser_indx)
print ("\ nfinal dataframe:")
Imprimer (FF)

Ici, vous pouvez voir la sortie.

Conclusion

L'indexation est le processus de sélection des valeurs à partir de lignes et de colonnes spécifiques dans un dataframe. Nous pouvons choisir toutes les lignes et certaines colonnes ou lignes et toutes les colonnes en utilisant l'indexation. Cette session a discuté des sujets tels que ce qu'est l'index et comment vous pouvez définir l'index lors de la génération d'un DataFrame, comment vous pouvez définir les colonnes DataFrame existantes en tant qu'index ou même multi-index, et comment vous pouvez définir des objets Python tels que Range, List, ou même les séries comme un index.