Échantillons de données
Avant de discuter de la façon de déterminer le nombre de valeurs uniques dans une dataframe, nous aurons besoin de données d'échantillons.
Un exemple de code est illustré ci-dessous:
# Importer des pandasLe code ci-dessus doit créer un exemple de dataframe que nous pouvons utiliser dans ce tutoriel. La forme tabulaire résultante des données est comme indiqué:
Méthode unique des pandas # 1
La fonction unique () est la première méthode que nous pouvons utiliser pour déterminer le nombre de valeurs uniques dans un dataframe.
La fonction prend une série comme entrée et renvoie une liste des valeurs uniques.
Par exemple, pour calculer les articles uniques dans la colonne de salaire, nous pouvons faire:
Imprimer (PD.unique (df ['salaire']))Le code ci-dessus doit renvoyer les articles uniques dans la colonne «Salaire».
[120000 100000 90000 110000 56000]Si vous souhaitez le nombre de valeurs uniques, vous pouvez obtenir la longueur de la liste comme indiqué:
Imprimer (F "Éléments uniques: Len (PD.unique (df ['salaire'])) ")Le code ci-dessus doit retourner:
Articles uniques: 5Fonction de nouins # 2 Pandas
La fonction NUnique () vous permet d'obtenir le nombre de valeurs uniques le long d'un axe spécifié.
Un exemple est comme indiqué:
print (f "[nombre d'éléments uniques / colonne] \ n df.nounique (axe = 0) ")Le code ci-dessus doit renvoyer le nombre d'éléments uniques dans chaque colonne. La sortie résultante est comme indiqué:
[Nombre d'éléments uniques / colonne]Vous pouvez également récupérer le nombre d'éléments uniques dans une colonne spécifique comme indiqué:
Imprimer (DF.salaire.NUnique ())Ce qui précède doit renvoyer le nombre d'articles uniques dans la colonne de salaire.
# 3 Pandas Value_Counts ()
Pandas nous fournit également la fonction Value_Count (). Cette fonction renvoie le nombre de valeurs uniques dans une colonne spécifiée.
Un exemple est comme indiqué:
res = list (df.salaire.Value_Coutets ())La fonction Value_Coutets () renvoie le nombre de chaque valeur dans la colonne. Nous convertissons ensuite le résultat en une liste et obtenons la longueur.
Cela devrait obtenir le nombre d'éléments uniques dans la colonne:
Articles uniques: 5Conclusion
Cet article a discuté de diverses méthodes et techniques que nous pouvons utiliser pour déterminer le nombre de valeurs uniques dans un Pandas DataFrame.