Pandas dataframe sélectionnez les lignes par condition

Pandas dataframe sélectionnez les lignes par condition
«Dans« Python », nous avons une bibliothèque Open_Source qui est la bibliothèque« Pandas ». Dans «Pandas», nous pouvons effectuer plusieurs tâches facilement et efficacement. Comme nous le savons, nous pouvons créer des données de données dans les «pandas» en utilisant les méthodes «pandas». Ainsi, après avoir créé les dataframes, nous pouvons sélectionner des lignes en appliquant des conditions. Nous pouvons utiliser différentes méthodes que «Pandas» fournissent à la sélection des lignes de la dataframe en fonction de la condition que nous avons ajoutée dans les méthodes «pandas». Nous discuterons de toutes les méthodes que nous pouvons utiliser pour sélectionner les lignes dans le DataFrame dans «Pandas», dans ce guide."

Méthodes pour sélectionner des lignes de DataFrame par condition

Le «Pandas» fournit quatre méthodes différentes pour sélectionner les lignes du DataFrame par condition. Ces méthodes sont ici:

  • Trame de données.Méthode Query ().
  • Trame de données.Méthode loc ().
  • Trame de données.Méthode isin ().
  • Trame de données.Méthode filtre ().
  • Datafarme.Méthode ILOC ().
  • Trame de données.Méthode appliquer ().

Toutes ces méthodes sont utilisées dans «Pandas» pour sélectionner les lignes des «pandas» DataFrame. Nous mettons également la condition dans ces méthodes, et elles sélectionneront les lignes en fonction de cette condition. Nous utiliserons ces méthodes et sélectionnerons les lignes de ce guide et expliquerons chaque code en détail ici.

Exemple # 01
L'outil que nous utiliserons dans ce guide pour développer le code «Pandas» est l'outil «Spyder». Nous générons le code «Pandas» en important les modules de «Pandas», puis nous développons une liste nommée «Matric_class» qui contient «nom» qui contient des noms d'étudiants comme «Peter, George, Bromley, Samuel, Leo , Farnham et Lily ».

Après cela, nous ajoutons quelques marques de ces étudiants dans différentes matières et ces matières sont «l'anglais, l'ordinateur, la physique, la chimie et la biologie». Dans «English», nous avons ajouté «46, 32, 54, 71, 68, 31 et 54», dans «Computer», nous avons ajouté «82, 23, 48, 34, 32, 15 et 33», puis vient la «physique», dans laquelle nous avons ajouté «29, 31, 27, 55, 29, 20 et 32», puis la «chimie» est là qui contient «59, 32, 57, 85, 59, 55 et 81 », La« biologie »est la prochaine dans laquelle les marques sont« 90, 31, 84, 95, 98, 72 et 77 ». Ceci est la liste des imbriquées «matric_class».

Maintenant, nous devons convertir cette liste imbriquée en DataFrame, donc à cette fin, nous avons utilisé la méthode «Pandas», qui est également illustrée ci-dessous.Trame de données". Cette méthode modifie la liste "matric_class" dans le dataframe nommé "matric_class_df". Cette "matric_class_df" est ensuite placée dans la méthode "print ()". Ici, le dataframe est terminé et également rendu.

Maintenant, nous devons exécuter ce code. Ainsi, comme nous travaillons sur l'outil «Spyder», c'est pourquoi nous appuyons sur l'icône «Run» de cet outil d'exécution; Après cela, le résultat suivant est rendu dans lequel le DataFrame est rendu. Maintenant, nous allons sélectionner certaines lignes de cette dataframe en utilisant la méthode «pandas» en fonction de certaines conditions, que nous ajouterons la méthode «pandas».

Ici, nous filtrons certaines lignes en mettant le nom DataFrame, et la condition que nous avons ajoutée dans cette méthode est que le «nom» est égal à «Bromley», donc ce sera la ligne dans laquelle le nom de l'étudiant est «Bromley» et stocker la ligne "Bromley" dans "result_df". Le résultat de "Bromley" est maintenant rendu à l'écran en le mettant dans "print ()".

La ligne complète est affichée ici, qui contient les données du «Bromley». Nous avons filtré cette ligne à partir du dataframe en mettant la condition dans la méthode «pandas».

Exemple # 02
Nous utilisons à nouveau le "matric_class_df", et nous sélectionnons ici des lignes autres que "Bromley". Ainsi, la condition que nous mettons ici est que le «nom» de l'élève n'est pas égal à «Bromley». Il sélectionnera ou filtrera toutes les lignes dans lesquelles le nom de l'étudiant n'est pas «Bromley» et rend également toutes les lignes à l'exception de la ligne qui contient le nom «Bromley» dans la colonne «Nom».

Ici, il sélectionne toutes les lignes dans le dataframe d'origine à l'exception de la ligne d'index à 2 car, dans cette ligne, la colonne "Nom" contient "Bromley". Donc, il ignore cette ligne et sélectionne toutes les autres lignes du DataFrame, et les rend ici.

Exemple # 03
Maintenant, nous créons une nouvelle liste pour le nouvel exemple ici dans lequel la liste créée est «ABC_LIST». Dans la colonne «Nom», nous ajoutons «James, Milli, Farnham, Lily, Leo, Samuel et Fuller». Ensuite, nous avons les «codes», dans lesquels nous insérons «ABC19, ABC34, ABC39, ABC45, ABC59, ABC62 et ABC15». Vient ensuite le «mois», qui contient «juillet, avril, juillet, août, septembre, juillet et octobre». Les «unités» ont «19, 14, 9, 16, 15, 10 et 13». Cette liste est convertie en DataFrame, puis le DataFrame est rendu.

Après cela, nous utilisons le «DataFrame.Méthode query () ”pour sélectionner certaines lignes. Nous mettons la condition qui est «mois == juillet», ce qui signifie qu'il sélectionne toutes ces lignes dans lesquelles le «mois» est «juillet». Ces lignes sont enregistrées dans «ABC_DF2», puis nous affichons ces lignes qui contiennent le mois «juillet» en utilisant «print ()»

Le DataFrame d'origine contient 7 lignes, et nous sélectionnons les lignes dans lesquelles le mois est «juillet», donc seules trois lignes sont présentes dans ce DataFrame, qui contient «juillet», et ces trois lignes sont également rendues séparément après le dataframe original.

Exemple # 04
Le dataframe qui est créé dans cet exemple est nommé «patient», contenant «Nom, City, Sitting_No et Fee / Sit. Les noms des patients sont dans le «nom», qui sont «James, Noah, Peter, Bromley et Samuel». Les villes de ces patients sont insérées dans «City», qui sont «New York, Birmingham, New York, Los Angeles et Banglore». Ensuite, nous avons mis le nombre de séances dans «SISTS_NO», qui sont «2, 6, 4, 4 et 3». Nous insérons également les frais par assiette de ces patients, qui sont «6000, 6000, 6900, 7400 et 6300».

Après cela, la liste «patient» est également transformée en «patient_df», qui est le dataframe ici. Ensuite, nous imprimons «patient_df», et après l'impression, nous nous déplaçons pour utiliser la méthode «loc» ici, ce qui nous aide à sélectionner les lignes. La condition que nous avons fixée ici est qu'elle sélectionne les lignes dans lesquelles le «SITSE_NO» du patient est «4» et montre également ces lignes sur le terminal.

Seules deux lignes sont là dans le dataframe dans lequel le «SITSE_NO» du patient est «4», et vous pouvez également noter ces lignes dans la sortie ci-dessous.

Exemple # 05
Maintenant, nous fournissons un autre exemple ici, et nous créons directement le DataFrame «Teacher_DF» ici dans lequel les colonnes que nous avons ajoutées sont «Exam_code, Examiner_Name, Examiner_Duty_Num, Exam_room_No et Exam_Block». Nous insérons également des données dans toutes les colonnes de la même manière que nous avons expliqué dans nos codes précédents. Ensuite, nous rendons également «Teacher_DF», nous filtrons ici les lignes en utilisant la méthode «isin ()». Nous initialisons une variable «données» avec «A et C», puis plaçons les «données» dans la méthode «isin ()» et mettons également le nom de colonne dans lequel il vérifie ces valeurs de données. Le nom de la colonne est «examen_block» ici, donc il vérifiera la colonne «EXAM_BLOCK» et sélectionne les lignes dans lesquelles le «Exami_block» est «A» ou «C», puis impriment ces lignes où cette condition est satisfaite.

Cette méthode «isin ()» sélectionne toutes les colonnes où le «Exam_block» est «A» ou «C». Dans ce DataFrame, seules cinq lignes apparaissent qui satisfont cette condition, et celles-ci sont également affichées ici.

Conclusion

Ce guide présente le concept de «sélection des lignes de dataframe par la condition en pandas». Nous avons discuté de différentes méthodes qui sont utilisées pour sélectionner les lignes en pandas en fonction de certaines conditions. Nous avons utilisé quatre méthodes dans nos codes ici et nous avons également expliqué chacun d'eux en détail. Nous avons montré comment nous mettons la condition dans ces méthodes et comment ces méthodes renvoient ou sélectionnons les lignes du dataframe. Nous avons discuté que lorsque nous mettons la condition dans n'importe quelle méthode que nous avons expliquée ici pour sélectionner les lignes, elle vérifie cette condition et sélectionne ces lignes dans le dataframe, qui satisfait la condition donnée. Nous avons affiché la sortie avec le script de code dans ce guide.