Pandas sélectionner la ligne par index

Pandas sélectionner la ligne par index
La sélection des lignes à partir d'un dataframe pourrait être nécessaire pour une variété de tâches d'analyse des données. Lors de la sélection de certaines lignes et de la rééchantillonnage de Pandas DataFrames and Series, la technique PANDAS «ILOC []» pour l'indexation basée sur les entiers est utilisée.

Vous pouvez l'utiliser en suivant la syntaxe donnée:

Seules les entrées à valeur entière sont gérées par la propriété «Iloc []». Ces entrées, cependant, peuvent être transmises de plusieurs manières.

Vous apprendrez diverses approches de la sous-définition de Pandas DataFrames à l'aide de la propriété «Iloc []» dans ce tutoriel.

Exemple 1:

Pour sélectionner une seule ligne dans le DataFrame par index, nous examinerons la démonstration pratique du «DF.Méthode Iloc [] ”fournie par Pandas.

La compilation et l'exécution des exemples seront effectuées dans l'outil «Spyder». Nous avons donc lancé l'outil et recherché les bibliothèques requises. Nous avons constaté que la boîte à outils «Pandas» est ce dont nous avons besoin pour travailler avec des méthodes pour sélectionner les lignes. La bibliothèque Pandas est importée dans le programme et «PD» est défini comme son alias. Partout où dans le code, nous devons appeler les pandas, utiliser «PD» au lieu de «pandas».

La première utilisation de la boîte à outils Pandas survient lorsque nous devons générer un Pandas DataFrame en utilisant le «PD.Méthode DataFrame () ». Nous appelons le «PD.Fonction DataFrame () ”et spécifiez des valeurs pour elle. Nous voulions qu'il crée un dataframe ayant 3 colonnes: «montagnes», «altitude» et «continent». Les valeurs ont été identifiées pour chaque colonne et la longueur de la colonne est maintenue égale pour toutes les colonnes.

La colonne «Montagnes» tient les noms des chaînes de montagnes qui sont «Karakoram», «Hindu Kush», «Alaska Range», «Himalaya» et «Andes». La deuxième colonne «Altitude» stocke la longueur en mètres de ces chaînes de montagnes. Les valeurs de cette colonne sont «8611», «7708», «6194», «8848» et «6961». La dernière colonne «continent» est le nom du continent où se trouvent ces montagnes: «Asie», «Asie», «N_America», «Asie» et «S_America».

Le constructeur de dataframe, lorsqu'il est appelé, crée un dataframe avec des données fournies. Mais si nous l'appelons à nouveau dans le même programme avec de nouvelles données, elle perdra la précédente. En effet, il ne trouve aucun stockage pour mettre le dataframe dans. Nous devons créer un espace pour le préserver. Pour maintenir le DataFrame pour pouvoir l'utiliser par la suite, nous avons créé un objet DataFrame «Faits». Il stockera le dataframe avec des colonnes et des lignes spécifiées.

Pour afficher le résultat, Python nous donne une méthode simple qui est la méthode «print ()». Il prend simplement l'entrée et le présente sur le terminal. L'entrée peut être une fonction, une variable / objet, une opération mathématique ou une chaîne à afficher. Étant donné que nous voulons afficher notre NATAL DATAFRAME nouvellement créé, nous avons fourni l'objet DataFrame «Facts» comme entrée de la méthode «print ()» de Python.

Pour exécuter le script, nous avons appuyé sur les touches «Shift + Enter». Voici notre DataFrame avec 3 colonnes et 5 lignes présentées sur le terminal qui peut être vu dans l'instantané ci-dessous.

Maintenant, la récupération d'une seule ligne dans le dataframe fourni sera explorée. La sélection est basée sur l'index. Pour cela, le Pandas DataFrame a la propriété «DF.Iloc [] ». Seules les valeurs entières peuvent être transmises dans cette méthode de sélection.

Nous avons utilisé le «DF.ILOC [] ”Propriété juste après avoir affiché le dataframe. Le nom de nos «faits» de DataFrame est fourni avec la méthode «Iloc []». Entre les crochets de la propriété, le numéro d'index, de la ligne que nous voulons extraire, est spécifié. Ici, nous avons fourni le numéro d'index «3». Ainsi, la propriété «Iloc []» examinera les données «Facts» et recherchera la ligne avec l'index numéro 3. Il correspondra à l'index que nous avons fourni avec chaque index du DataFrame et sélectionnera la ligne qui est égale au numéro d'index d'entrée. Après avoir récupéré la ligne, il sera placé dans la variable «Box» que nous avons créée pour stocker le résultat de la propriété «Iloc []». Enfin, le résultat sera affiché sur la console en utilisant la méthode «print ()».

La ligne avec l'index 3 est récupérée. Vous pouvez le voir dans l'image ci-dessous. La rangée avec l'indice numéro 3 a une montagne nommée Himalaya, l'altitude est de 8848 et le continent est l'Asie. De plus, le type de données de cette ligne mentionnée est «Objet».

Exemple n ° 2:

Dans l'illustration ci-dessus, nous avons appris à sélectionner une seule ligne par index en utilisant la propriété Pandas DataFrame «Iloc []». Cette instance parlera de la sélection de plusieurs lignes dans un dataframe par index.

Nous avons utilisé le «DF.ILOC [] »Propriété. Nous utilisons également le DataFrame créé ci-dessus dans ce cas. Le nom de DataFrame «Facts» est écrit avec la propriété «Iloc []» et dans son opérateur d'indice, nous avons utilisé un autre support carré pour spécifier plusieurs index. Si vous n'ajoutez pas le 2e support carré, il lancera une erreur. Les index que nous avons sélectionnés à afficher sont «0», «2» et «4». Il extrait donc les lignes 1, 3 et 5. Le résultat sera stocké dans la variable «multiple». La fonction «print ()» présentera la sortie.

Les 3 lignes sélectionnées ont été affichées sur le terminal.

En plus de sélectionner plusieurs lignes dans une dataframe, vous pouvez également sélectionner les colonnes doivent être affichées avec les lignes.

Dans les crochets de la méthode «Iloc []», nous avons défini les index pour les lignes et les index de la colonne à sélectionner. Dans le premier opérateur d'indice, nous avons mentionné les index pour les lignes comme «1», «2» et «3» et des index de colonne dans le 2ème comme «0» et «2». La sortie est présentée à l'aide de la méthode «print ()».

Trois lignes avec 2 colonnes ont été sélectionnées dans le Dataframe qui en résulte.

Exemple # 3:

La dernière technique pour exercer la propriété «Iloc []» est de sélectionner les lignes par valeur d'indexer sera mise en pratique dans cet exemple.

Lorsqu'il s'agit de sélectionner un grand nombre de lignes dans un dataframe par les valeurs d'index, cela prend beaucoup de temps pour spécifier les index des lignes une par une, en particulier lorsqu'il s'agit de grands ensembles de données. Ici, la propriété Pandas DataFrame «Iloc []» nous permet de fournir une gamme de valeurs.

Nous avons exercé le «DF.ILOC [] ”Propriété avec le dataframe généré en première instance. La plage des valeurs d'index est spécifiée comme «1: 4». Ici «1» est le numéro d'index de démarrage et «4» est la dernière valeur d'index. Il sélectionnera les valeurs entre cette plage, y compris la valeur d'index de démarrage, mais à l'exclusion de la dernière valeur d'index spécifiée. La variable «plage» est créée pour maintenir la sortie ». La fonction «print ()» est invoquée pour montrer le résultat.

Cela nous donne le dataframe qui peut être vu dans l'image de sortie attachée ci-dessous.

Conclusion

Dans cet article, nous avons discuté de la sélection des lignes dans un dataframe en utilisant les valeurs d'index. Nous avons utilisé le Pandas DataFrame «DF.ILOC [] »Propriété pour obtenir les résultats souhaités. Diverses techniques pour utiliser la propriété «Iloc []» ont été expliquées et implémentées à l'aide des exemples de codes. Le premier exemple nous indique le moyen d'extraire une seule ligne par index, la 2e illustration a travaillé sur la sélection de plusieurs lignes par index et des lignes sélectionnées avec des colonnes spécifiées et la dernière instance a donné une idée de l'entrée de la plage de valeurs d'index.