Pandas pas

Pandas pas
Le «Pandas» est la bibliothèque de «Python». Nous pouvons créer une dataframe dans «pandas». Après avoir créé un dataframe dans «pandas», nous appliquons ensuite certaines fonctions à cette dataframe pour faire le travail que nous voulons faire. Nous pouvons également vérifier certaines données dans le DataFrame si les données sont présentes dans le dataframe ou non. Pour vérifier les données dans une dataframe, nous pouvons utiliser le filtre «pas in» dans «pandas». Cela vérifiera ces données spécifiques dans le dataframe que nous avons mentionné dans le code et renvoyez le résultat. Dans ce guide, nous discuterons de la façon d'appliquer le filtre «non dans» sur une seule colonne ainsi que sur plusieurs colonnes dans le «pandas» DataFrame. Nous passons maintenant aux codes de «pandas» où nous allons vérifier certaines valeurs dans différentes colonnes du dataframe.

Exemple # 01:

L'outil «Spyder» est utilisé pour écrire chaque script de code dont nous discuterons dans ce guide. Chaque fois que nous voulons développer un nouveau code «pandas», nous devons importer quelques modules «pandas». Ceux-ci peuvent être importés en suivant simplement le terme «import» avec l'expression «pandas comme pd. Maintenant, ce "PD" a été ajouté à ce code chaque fois que nous devons accéder aux fonctions "Pandas" ". Maintenant, nous devons créer le dataframe.

La variable «raw_record» est l'endroit où nous ajoutons des données que nous voulons insérer dans le dataframe. Les dates sont ajoutées en premier qui sont «12/08/22, 12/08/22, 13/08/22, 14/08/22, 15/08/22 et 17/08/22» dans le «daté». Ensuite, nous avons un «nom» dans lequel nous mettons «Ball Pen, Pointer, Eraser, Agrafler, Scale et Glue Stick». Après cela, nous ajoutons la quantité de ces éléments dans la «quantité» qui sont «18, 21, 36, 4, 15 et 9». Nous ajoutons également le prix de la colonne «Prix» qui est «350, 520, 220, 900, 90 et 250».

Maintenant, nous insérons le «PD.DataFrame () "qui aide à convertir ce" raw_record "en" raw_record_df ", qui est le nom du dataframe. Nous initialisons ensuite une variable nommée «valeurs» avec certaines données qui sont «Ball Pen, pointeur, bâton de colle». Après cela, nous appliquons le filtre «non dans» pour vérifier certaines données. Nous utilisons ce filtre «pas en» avec la méthode «isin ()». Pour filtrer les données utilisant la méthode «Not in», nous avons mis le signe «~». Vous pouvez voir ci-dessous que nous avons mentionné le nom de DataFrame en premier et à l'intérieur, nous plaçons le nom de la colonne dans lequel nous voulons vérifier les données.

Nous plaçons le signe «~» avant de placer le nom de la colonne avec le nom de DataFrame. Ensuite, nous mettons la méthode «isin ()» après cela et passons la variable «valeurs» à cette fonction «isin ()». Nous stockons le résultat que nous obtenons après avoir appliqué cette fonction dans la variable «restant_values». Maintenant, nous placons les «restes_values» dans le «print ()», donc le résultat que nous obtenons ici après avoir appliqué ce filtre «pas en» sera affiché.

Nous pouvons rapidement obtenir les résultats des codes «Pandas» dans le «Spyder» en appuyant sur «Shift + Entrée» ou l'icône Run. Le résultat de ce code contient le dataframe avec toutes les données que nous y avons ajoutées. Ensuite, il filtre certaines données et affiche les lignes dans lesquelles la colonne «Nom», la colonne «Nom». Nous filtrons cette dataframe à l'aide de la méthode de filtre «non dans».

Exemple # 02:

Le DataFrame "Pre_Rank_Record" est créé dans cet exemple qui contient des colonnes "Name, Pre_Rank et New_Fee". Ces colonnes contiennent également des données. Dans la colonne «Nom», nous avons ajouté «Stella, Tatum, George, Peter, Kenna et Lila». Ensuite, nous mettons «Python, base de données, intelligence artificielle, python, développement Web et python» dans la colonne «pre_rank». Les frais que nous insérons dans la colonne «Fee» sont: «1300, 1900, 2000, 1300, 1500 et 1300». Nous imprimons également le "pre_rank_record" en utilisant "print ()".

Après avoir terminé ce DataFrame, nous mettons la variable «valeurs1» et l'avons initialisée avec deux noms qui sont «Stella et George». Nous utilisons ensuite le filtre «non dans» pour filtrer les colonnes «nom» dans lesquelles les noms ne sont pas dans les valeurs que nous avons ajoutées dans la variable VALEUR1. Cela signifie que le nom n'est pas «Stella» ni «George». Nous plaçons le nom du dataframe, le symbole «~» et le nom du dataframe avec le nom de colonne dans lequel nous voulons filtrer les données. La colonne où nous devons appliquer cette fonction est la colonne «Nom» et nous mettons également le nom de variable «valeurs1» dans la méthode «isin ()».

Maintenant, nous voulons également filtrer les données de la colonne "Pre_Rank". Pour cela, nous initialisons la variable «VALEUR2» avec certaines données de la colonne «Pre_Rank» que nous voulons filtrer à partir de la colonne «Pre_Rank». Maintenant, nous plaçons à nouveau le filtre «pas dans» pour filtrer les données et afficher les lignes restantes dans lesquelles le «Python» n'est pas présent dans la colonne «Pre_Rank». Après cela, nous utilisons également le filtre «pas in» pour filtrer les données de la dernière colonne qui est «new_fee». Nous plaçons la variable «Values3» et initialisons la «valeurs3» avec deux valeurs que nous avons ajoutées dans la colonne «new_fee». Ensuite, nous imprimons les valeurs restantes dans lesquelles les valeurs «valeurs3» ne sont pas présentes.

Il affiche le dataframe, d'abord, dans ce résultat. Ensuite, il affiche le dataframe que nous avons entré dans le code ci-dessus. Tout d'abord, il affiche ces lignes du DataFramewhere «Stella et George» qui ne sont pas présents dans la colonne «Nom». Ensuite, il affiche les lignes dans lesquelles le "Python" n'est pas présent dans la colonne "Pre_Rank" et affiche également ces lignes du dataframe dans lequel "1300 et 2000" ne sont pas présents dans la dernière colonne "New_Fee".

Exemple # 03:

Nous utilisons le dataframe «enregistré» qui contient les mêmes données que nous avons ajoutées dans le dataframe «pre_rank_record». Nous venons de changer le nom de DataFrame ici. Maintenant, nous filtrons les données en utilisant le filtre «Not in» avec plusieurs colonnes du DataFrame «pre_rank_record». Nous mettons «Tatum, Kenna, 1900» dans la variable «my_list1» où «Tatum et Kenna» sont les valeurs de la colonne «Nom» et «1900» est la valeur de la colonne «new_fee».

Comme nous avons ajouté les valeurs de deux colonnes différentes de la variable «my_list1», nous insérons également les noms des deux colonnes ci-dessous où nous utilisons le filtre «non dans». Après avoir ajouté le nom de DataFrame et du symbole «~», nous avons mis les noms des deux colonnes avec le nom de DataFrame. Ensuite, nous plaçons la méthode «isin ()» dans laquelle nous passons la variable «my_list1». Nous plaçons également «axe = 1» avec cela.

Maintenant, nous initialisons une autre variable qui est la variable «my_list2» avec «Lila» et «Intelligence artificielle». Ici, "Lila" est la valeur de la colonne "Nom" et "l'intelligence artificielle" est la valeur de la colonne "Pre_Rank". Après cela, nous utilisons à nouveau le filtre «pas in» de la même manière que nous avons expliqué dans les lignes ci-dessus dans cet exemple.

Après avoir affiché le DataFrame complet, il ne fait que les lignes dans lesquelles les lignes ne contiennent pas «Tatum, Kenna et 1900» dans les colonnes «Nom» et «New_Fee». Ensuite, cela rend les lignes où nous n'avons pas «Lila et l'intelligence artificielle» dans les colonnes «nom» et «pre_rank».

Conclusion

Le filtre «non dans» est expliqué dans ce guide en détail avec les codes et les résultats de ces codes. Nous avons expliqué comment filtrer les données à l'aide de la méthode «non dans» et quelle est la meilleure façon d'utiliser cette méthode dans «Pandas». Nous avons également montré les codes dans lesquels nous avons utilisé ce filtre «pas dans» avec la méthode «isin ()» et avons expliqué chaque étape du code en détail ici. Nous avons rendu les données de la dataframe après avoir appliqué la méthode de filtre «non dans» à la dataframe et avons montré le dataframe après avoir appliqué le filtre «non dans» et avons expliqué qu'il affiche les données restantes de la dataframe dans laquelle les valeurs sont pas présent que nous avons mentionné dans la méthode du filtre «non dans».