Les pandas comptent distincts

Les pandas comptent distincts
Cet article explorera différentes manières et méthodes pour déterminer le nombre d'éléments uniques dans un Pandas DataFrame.

Échantillons de données

Avant de discuter de la façon de déterminer le nombre de valeurs uniques dans une dataframe, nous aurons besoin de données d'échantillons.

Un exemple de code est illustré ci-dessous:

# Importer des pandas
Importer des pandas en tant que PD
df = pd.Trame de données(
«Salaire»: [120000, 100000, 90000, 110000, 120000, 100000, 56000],
«Département»: [«Développeur de jeux», «développeur de base de données», «développeur frontal», «développeur complet», «développeur de base de données», «chercheur en sécurité», «cloud-ingénieur»],
«Note»: [4.3, 4.4, 4.3, 3.3, 4.3, 5.0, 4.4],
index = [«Alice», «Michael», «Joshua», «Patricia», «Peter», «Jeff», «Ruth»])
df

Le code ci-dessus doit créer un exemple de dataframe que nous pouvons utiliser dans ce tutoriel. La forme tabulaire résultante des données est comme indiqué:

Méthode unique des pandas # 1

La fonction unique () est la première méthode que nous pouvons utiliser pour déterminer le nombre de valeurs uniques dans un dataframe.

La fonction prend une série comme entrée et renvoie une liste des valeurs uniques.

Par exemple, pour calculer les articles uniques dans la colonne de salaire, nous pouvons faire:

Imprimer (PD.unique (df ['salaire']))

Le code ci-dessus doit renvoyer les articles uniques dans la colonne «Salaire».

[120000 100000 90000 110000 56000]

Si vous souhaitez le nombre de valeurs uniques, vous pouvez obtenir la longueur de la liste comme indiqué:

Imprimer (F "Éléments uniques: Len (PD.unique (df ['salaire'])) ")

Le code ci-dessus doit retourner:

Articles uniques: 5

Fonction de nouins # 2 Pandas

La fonction NUnique () vous permet d'obtenir le nombre de valeurs uniques le long d'un axe spécifié.

Un exemple est comme indiqué:

print (f "[nombre d'éléments uniques / colonne] \ n df.nounique (axe = 0) ")

Le code ci-dessus doit renvoyer le nombre d'éléments uniques dans chaque colonne. La sortie résultante est comme indiqué:

[Nombre d'éléments uniques / colonne]
salaire 5
département 6
note 4
DTYPE: INT64

Vous pouvez également récupérer le nombre d'éléments uniques dans une colonne spécifique comme indiqué:

Imprimer (DF.salaire.NUnique ())

Ce qui précède doit renvoyer le nombre d'articles uniques dans la colonne de salaire.

# 3 Pandas Value_Counts ()

Pandas nous fournit également la fonction Value_Count (). Cette fonction renvoie le nombre de valeurs uniques dans une colonne spécifiée.

Un exemple est comme indiqué:

res = list (df.salaire.Value_Coutets ())
print (f "Éléments uniques: len (res)")

La fonction Value_Coutets () renvoie le nombre de chaque valeur dans la colonne. Nous convertissons ensuite le résultat en une liste et obtenons la longueur.

Cela devrait obtenir le nombre d'éléments uniques dans la colonne:

Articles uniques: 5

Conclusion

Cet article a discuté de diverses méthodes et techniques que nous pouvons utiliser pour déterminer le nombre de valeurs uniques dans un Pandas DataFrame.