Pandas et condition

Pandas et condition
«Nous pouvons définir les« pandas »comme un outil open-source. Nous pouvons créer différents dictionnaires et frames de données à l'aide de «pandas». Nous pouvons également appliquer des conditions et des opérateurs à nos données dans des «pandas». Ici, nous discuterons de l'opérateur «et», que nous utiliserons dans nos conditions dans «Pandas». Lorsque nous utilisons l'opérateur «et» dans une condition, il renverra «vrai» si toutes les conditions sont satisfaites, et si une condition n'est pas satisfaite, elle renvoie «False». Dans la plupart des langages de programmation, il est symbolisé par le signe «&&», mais dans la programmation Pandas, il est symbolisé par «&». Nous explorerons «et la condition» dans ce tutoriel."

Syntaxe

df [(cond_1) & (cond_2)]

Exemple 01

Nous faisons ces codes sur l'application «Spyder» et utiliserons l'opérateur «et» dans nos conditions dans «Pandas» ici. Comme nous faisons les codes de pandas, nous devons d'abord importer les «pandas en tant que PD» et obtiendrons sa méthode en mettant simplement «PD» dans notre code. Ensuite, nous générons un dictionnaire avec le nom «cond» et les données que nous insérons ici sont «A1», «A2» et «A3» sont les noms de colonne, et nous ajoutons «1, 2 et 3» dans le «dans le« dans le «1» dans le « A1 ", dans" A2 ", il y a" 2, 6 et 4 "et le dernier" A3 ", contient" 3, 4 et 5 ".

Ensuite, nous déménageons pour faire le dataframe de ce dictionnaire en utilisant le «PD.Dataframe "ici. Cela renverra le dataframe des données du dictionnaire ci-dessus. Nous le rendons également en fournissant le «print ()» ici, et après cela, nous appliquons certaines conditions et utilisons également l'opérateur «&» dans cette condition. La première condition ici est que «a1> = 1», puis nous mettons l'opérateur «&» et placez une autre condition qui est «A2 = 1» et aussi «A2 < 5”. If both conditions are satisfied here, then it will display the result, and if any one of them is not satisfied here, then it will not display any data.

Il vérifie les colonnes «A1» et «A2» du DataFrame, puis renvoie le résultat. Le résultat s'affiche à l'écran car nous utilisons l'instruction «print ()».

Le résultat est là. Il affiche toutes les données que nous avons insérées dans le dataframe, puis vérifie les deux conditions. Il renvoie les lignes dans lesquelles «a1> = 1» et aussi «A2 < 5”. We get two rows in this output because both conditions are satisfied in two rows.

Exemple 02

Dans cet exemple, nous créons directement le DataFrame après l'importation des «Pandas en tant que PD». La dataframe «Team» est créée ici, avec les données contenant quatre colonnes. La première colonne est la chronique «Teams» ici dans laquelle nous avons mis «A, A, B, B, B, B, C, C». Ensuite, la colonne à côté des «équipes» est «score», dans laquelle nous insérons «25, 12, 15, 14, 19, 23, 25 et 29». Après cela, la colonne que nous avons est «sortie» et nous y ajoutons également des données comme «5, 7, 7, 9, 12, 9, 9 et 4». Notre dernière colonne ici est la colonne «rebonds» qui contient également des données numériques, qui est «11, 8, 10, 6, 6, 5, 9 et 12».

Le DataFrame est terminé ici, et maintenant nous devons imprimer ce DataFrame, donc pour cela, nous plaçons le «print ()» ici. Nous voulons obtenir des données spécifiques de ce DataFrame, nous définissons donc certaines conditions ici. Nous avons deux conditions ici, et nous ajoutons l'opérateur «et» entre ces conditions, il ne rendra donc que les conditions qui rempliront les deux conditions. La première condition que nous avons ajoutée ici est le «score> 20» puis placer l'opérateur «&» et l'autre condition qui est «Out == 9».

Ainsi, il filtrera les données où le score de l'équipe est inférieur à 20 et leurs retraits sont 9. Il filtre ceux et ignore les autres, qui ne satisferont pas les deux conditions ou l'un d'eux. Nous affichons également ces données qui satisfont aux deux conditions, nous avons donc utilisé la méthode «print ()».

Seules deux lignes remplissent les deux conditions, que nous avons appliquées à ce DataFrame. Il ne filtre que les lignes dans lesquelles le score est supérieur à 20, et aussi, leurs retraits sont 9 et les affichent ici.

Exemple 03

Dans nos codes ci-dessus, nous insérons simplement les données numériques dans notre DataFrame. Maintenant, nous mettons des données de chaîne dans ce code. Après avoir importé les «Pandas en tant que PD», nous déménageons pour construire un «membre» DataFrame. Il contient quatre colonnes uniques. Le nom de la première colonne ici est «nom», et nous insérons les noms des membres, qui sont «Alliés, Bills, Charles, David, Ethen, George et Henry». La colonne suivante est nommée «Emplacement» ici, et il a «America. Canada, Europe, Canada, Allemagne, Dubaï et Canada ». La colonne «Code» contient «W, W, W, E, E, E et E». Nous ajoutons également les «points» des membres ici comme «11, 6, 10, 8, 6, 5 et 12». Nous rendons la dataframe «membre» avec l'utilisation de la méthode «print ()». Nous avons spécifié certaines conditions dans ce DataFrame.

Ici, nous avons deux conditions, et en ajoutant l'opérateur «et» entre eux, il ne retournera que des conditions qui remplissent les deux conditions. Ici, la première condition que nous avons présentée est «Location == Canada», suivie de l'opérateur «&», et la deuxième condition, «Points <= 9”. It gets those data from the DataFrame in which both conditions are satisfied, and then we have placed “print ()” which displays those data in which both conditions are true.

Ci-dessous, vous pouvez remarquer que deux lignes sont extraites du dataframe et affichées. Dans les deux lignes, l'emplacement est «Canada» et les points sont inférieurs à 9.

Exemple 04

Nous importons à la fois les «pandas» et «Numpy» en tant que «PD» et «NP», respectivement. Nous obtenons les méthodes «pandas» en plaçant les méthodes «PD» et «Numpy» en plaçant le «NP» si nécessaire. Ensuite, le dictionnaire que nous avons créé ici contient trois colonnes. Dans la colonne «Nom» dans laquelle nous insérons «Alliés, George, Nimi, Samuel et William». Ensuite, nous avons la colonne «OBT_MARKS», qui contient les marques obtenues des étudiants, et ces marques sont «4, 47, 55, 74 et 31».

Nous créons également une colonne pour les «prac_marks» qui ont les marques pratiques de l'étudiant. Les marques que nous ajoutons ici sont «5, 67, 54, 56 et 12». Nous faisons le dataframe de ce dictionnaire puis les imprimons. Nous appliquons le «NP.Logical_and ”ici, qui renverra le résultat sous forme« vrai »ou« faux ». Nous stockons également le résultat après avoir vérifié les deux conditions dans une nouvelle colonne, que nous avons créée ici avec le nom «Pass_status».

Il vérifie que «l'OBT_MARKS» est supérieur à «40» et «prac_marks» est supérieur à «40». Si les deux sont vrais, cela rendra vrai dans la nouvelle colonne; Sinon, ça rend faux.

La nouvelle colonne est ajoutée avec le nom «pass_status», et cette colonne se compose uniquement de «vrai» et «false». Cela rend vrai où les marques obtenues et les marques pratiques sont supérieures à 40 et fausses pour les lignes restantes.

Conclusion

L'objectif principal de ce tutoriel est d'expliquer le concept de «et de condition» dans les «pandas». Nous avons expliqué comment acquérir ces lignes où les deux conditions sont remplies, ou nous sommes également réalistes pour ceux où toutes les conditions sont remplies et fausses pour le reste. Nous avons exploré quatre exemples ici. Les quatre exemples que nous avons établis dans ce tutoriel ont traversé ce processus. Les exemples de ce tutoriel ont tous été manifestement présentés à votre avantage. Ce tutoriel devrait vous aider à comprendre cette idée plus clairement.