Pandas dataframe unique

Pandas dataframe unique

La bibliothèque Python la plus populaire utilisée en science des données est appelée Pandas. Il offre aux programmeurs Python de haute performance, convivial et des outils d'analyse des données. Une fois que vous comprenez les fonctions fondamentales et comment les utiliser, Pandas est un puissant outil pour modifier les données. Dans «Pandas», les méthodes standard pour stocker les données sous une forme tabulaire sont les dataframes. Nous pouvons utiliser certaines méthodes de «pandas» pour obtenir les valeurs uniques dans la colonne de Dataframe «Pandas». Lorsque nous avons besoin d'obtenir des valeurs uniques dans les colonnes de DataFrame et que nous ne voulons pas de duplication des valeurs dans la colonne de DataFrame «Pandas», nous pouvons utiliser les méthodes que «Pandas» fournit pour le faire. Examinons ces méthodes dans ce guide, ainsi que quelques exemples et sorties pour obtenir des valeurs uniques dans la colonne de DataFrame de «Pandas».

Méthodes pour obtenir des valeurs uniques dans les colonnes de Dataframe «Pandas»

Nous pouvons utiliser deux méthodes pour obtenir les valeurs uniques dans les colonnes de Dataframe «Pandas». Nous supprimons les valeurs en double et n'obtenons que les valeurs uniques dans les colonnes de DataFrames. Les méthodes que «Pandas» fournissent pour effectuer cette tâche sont:

  • En utilisant la méthode unique ().
  • En utilisant la méthode drop_dupliactes ().

Maintenant, nous utiliserons les deux méthodes dans les codes «Pandas» pour obtenir les valeurs uniques dans les colonnes de Dataframe «Pandas».

Exemple # 01

L'application «Spyder» est utilisée ici pour générer ces codes «Pandas» pour utiliser ces méthodes qui nous aident à obtenir les valeurs uniques dans les colonnes de Dataframe «Pandas». Nous devons importer les modules «pandas», qui sont nécessaires au code «pandas», avant de créer le dataframe. En utilisant le terme «import» et en plaçant «Pandas comme PD», nous importons ces modules.

Maintenant, à l'aide de «PD», nous pouvons rapidement obtenir les fonctions ou méthodes «pandas». Nous avons ensuite mis le «Subject_data» dans lequel nous ajoutons «nom» et dans le «nom», nous ajoutons les données du nom qui sont «Roman, William, Peter, Smith, John, Milli, Thomas et James». Ensuite, nous ajoutons les données de la matière dans le «Subj» qui sont des «mathématiques, économiques, sciences, mathématiques, statistiques, statistiques, statistiques et ordinateur». Ensuite, nous convertissons ce "sujet_data" en "Subject_df" DataFrame en utilisant le "PD.Méthode DataFrame () ». Nous placons "Subject_df" dans la méthode "print ()" afin qu'elle s'affiche sur le terminal.

Maintenant, nous voulons obtenir les valeurs uniques dans la colonne de Dataframe "Pandas" "Subj". À cette fin, nous utilisons la méthode «unique ()» ici et nous ajoutons le nom de la colonne et aussi le nom du DataFrame comme indiqué ci-dessous. Nous ajoutons cette méthode dans le «print ()», donc le résultat s'affiche également sur le terminal.

Maintenant, nous appuyons sur le «Shift + Entrée» pour obtenir le résultat de ce code et il se rend sur le terminal et est également affiché ici, qui contient le DataFrame avec toutes les valeurs. Ceci est le dataframe original que nous avons ajouté dans le code et ci-dessous, il affiche les valeurs uniques de la colonne «Subj». Il abandonne les valeurs en double et affiche les valeurs uniques de la colonne «Subj» du DataFrame.

Exemple # 02

Nous créons le «Sample_list» qui contient des informations. Nous insérons «Layla, 21, 28, 31, 14 et 39» qui apparaîtra comme la première colonne lorsque nous convertirons cette liste en DataFrame. Ensuite, nous ajoutons «Lusy, 31, 25, 34, 26 et 21» comme la deuxième ligne du DataFrame. Après cela, nous avons «Peter, 38, 20, 20, 35 et 24» et «Layla 38, 23, 39 24, 23» qui sera les troisième et quatrième rangées du DataFrame. Nous insérons également trois autres données qui sont «Stella, 21, 24, 24, 28, 31», «Layla, 33, 32, 26, 30, 25» et également «Peter, 21, 21, 31, 21, 29».

Maintenant, nous convertissons le "Sample_List" en "DF_Sample" qui est le nom du DataFrame ici en mettant le "PD.Fonction DataFrame () ”. De plus, nous définissons le nom des colonnes de ce DataFrame et ces noms sont "Name, ASS_1, ASS_2, ASS_3, ASS_4 et ASS_5". Ensuite, nous utilisons le "print ()" qui aide à afficher le dataframe "df_sample". Maintenant, nous utilisons une autre méthode dans cet exemple pour obtenir les valeurs uniques dans la colonne de DataFrame. Cette méthode est la méthode «drop_duplicate ()» de «pandas».

Dans la méthode "drop_duplicate ()", nous définissons le nom de la colonne où nous voulons obtenir les valeurs uniques dans la colonne de DataFrame. Nous obtenons des valeurs uniques de la colonne «Nom» en supprimant les valeurs en double dans cette colonne à l'aide de la méthode «drop_duplicate ()» et rendez également ces valeurs uniques en utilisant la fonction «print ()» ici.

Les noms dupliqués sont supprimés et des valeurs uniques sont rendues après avoir appliqué la méthode "drop_duplicate ()". Vous pouvez noter que le nom «Layla» apparaît dans trois cellules de la colonne «Nom». Mais lorsque la méthode "drop_duplicate ()" est appliquée à cette colonne, toutes les valeurs en double sont supprimées et un nom "Layla" est apparu à l'écran. Après avoir supprimé les valeurs en double, le nouveau DataFrame est apparu qui contient les valeurs uniques dans cette colonne «Nom». De cette façon, nous pouvons supprimer les valeurs en double et obtenir la valeur unique de la colonne de DataFrame à l'aide de la méthode "drop_duplicate ()".

Exemple # 03

La même dataframe est à nouveau utilisée et maintenant nous appliquons la méthode «unique ()» ici. Avec la méthode «unique ()», nous plaçons le nom de la colonne ainsi que le nom de DataFrame sur lequel nous voulons appliquer cette méthode «unique ()» pour obtenir les valeurs uniques. Cela ne rendra que les valeurs uniques de cette colonne et ne montrera pas ces valeurs sous la forme de DataFrame.

Ici, le DataFrame contient sept valeurs dans la colonne «Nom» mais lorsque nous appliquons la méthode «unique ()» à cette colonne, seules quatre valeurs sont apparues et ce sont les valeurs uniques de cette colonne. Il ne rend pas des valeurs en double.

Exemple # 04

Le dataframe que nous créons dans cet exemple est le "F_G_DF". Nous insérons «my_fruits» et «my_vegs» dans ce dataframe. La colonne «My_fruits» contient «Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear et Apple». Ensuite, nous avons le «my_vegs» qui contient les noms des légumes qui sont «piment, apport, carotte, pomme de terre, pomme de terre, carotte, oignon, ail et gingembre». Ce dataframe ne contient que deux colonnes.

Maintenant, nous obtenons les valeurs uniques dans les deux colonnes à l'aide de la méthode «unique ()». Nous mentionnons le nom du DataFrame. Ensuite, mettez la colonne au premier nom de colonne. Après cela, nous utilisons la méthode annexée (). Dans cette annexe, nous plaçons à nouveau le nom du DataFrame et le deuxième nom de colonne et placons la méthode «unique ()». Cela obtiendra les valeurs uniques des deux colonnes, puis ajoutera les valeurs uniques des deux colonnes et les apparaîtra à l'écran.

Le DataFrame est rendu d'abord contenant toutes les valeurs. Après cela, la méthode «unique ()» est appliquée et les valeurs uniques des deux colonnes sont rendues ci-dessous. Dans ce code, nous obtenons les valeurs uniques dans les multiples colonnes du DataFrame en utilisant la méthode «unique ()».

Conclusion

L'explication complète de l'obtention des valeurs uniques dans la colonne de DataFrame se trouve dans ce guide. Nous avons discuté des méthodes «uniques ()» et «drop_duplicate ()» qui nous aident à obtenir les valeurs uniques de la colonne de DataFrame. Nous avons exploré comment utiliser ces méthodes dans le code «pandas» en utilisant ces méthodes ici dans nos codes. Nous avons illustré différents exemples dans ce guide et vous avons montré comment obtenir les valeurs uniques d'une colonne en utilisant la méthode «unique ()» ainsi que la méthode «drop_duplicate ()». Nous avons également exploré comment obtenir les valeurs uniques dans plusieurs colonnes en utilisant la méthode «unique ()» de ce guide.