Python Count Duplicate dans la liste

Python Count Duplicate dans la liste
Avoir des doublons dans vos données peut provoquer de graves problèmes, en particulier lorsque vous travaillez avec de grandes quantités de données pour l'analyse des données ou le traitement des données. Par conséquent, il est du devoir du programmeur de détecter des doublons et de les supprimer des données. Ce message se concentrera sur les premiers et expliquera les différentes méthodes à travers lesquelles l'utilisateur peut facilement détecter et compter les doublons dans une liste Python.

Le contenu de ce guide est donné ci-dessous:

  • Méthode 1: Utilisation de la liste pour définir la conversion
  • Méthode 2: Utilisation de la compréhension de la liste et du count () Méthode
  • Méthode 3: Utilisation de la compréhension de la liste avec une condition si

Commençons par la première méthode tout de suite!

Méthode 1: Utilisation de la liste pour définir la conversion

Une liste dans Python peut contenir des doublons, ce qui signifie qu'il n'y a pas d'unicité comme celle trouvée dans les ensembles de python. Par conséquent, un moyen facile de détecter s'il y a des doublons dans une liste Python est de le convertir en un ensemble et de comparer la taille des deux.

Pour démontrer cela, commencez par créer une liste dans Python en utilisant le code suivant:

listvar = [123,46,11,78,334,46,98,11,90]

Après cela, utilisez la méthode set () pour convertir cette liste en un ensemble et le stocker à l'intérieur d'une variable distincte:

setVar = set (listvar)

Imprimez le nombre d'éléments des deux en utilisant la méthode Len ():

Imprimer ("Éléments dans la liste:", Len (Listvar))
print ("Elements in Set:", Len (setvar))

Lorsque ce code est exécuté, il produit les résultats suivants sur le terminal:

Selon la sortie, le nombre d'éléments dans la liste est 9 et 7 pour l'ensemble. Cela signifie qu'il y a un total de deux doublons dans la liste. Mais, au lieu de calculer manuellement les doublons, vous pouvez également utiliser la ligne suivante:

print ("Nombre de doublons dans la liste", Len (listvar) -Len (setvar))

L'extrait de code complet avec cette nouvelle déclaration d'impression est:

listvar = [123,46,11,78,334,46,98,11,90]
setVar = set (listvar)
print ("Nombre de doublons dans la liste", Len (listvar) -Len (setvar))

Lorsque ce code est exécuté, il produit le résultat suivant sur le terminal:

Comme vous pouvez le voir sur l'image de sortie, il y a un total de deux doublons dans la liste.

Méthode 2: Utilisation de la compréhension de la liste et du count () Méthode

Une autre méthode d'impression des doublons d'une liste consiste à utiliser la méthode de compréhension de la liste pour récupérer chaque valeur de la liste, puis à l'aide de la méthode Count () pour vérifier son nombre dans la liste. Si le résultat de la méthode Count () est supérieur à un, vous pouvez ajouter cet élément à une liste de doublons.

Pour démontrer le fonctionnement de cette méthode, prenez le code suivant:

listvar = [123,46,11,78,334,46,98,11,90]
duplicatevar = []
Pour X dans Listvar:
Si listvar.compter (x)> 1:
duplicatevar.Ajouter (x)
Print ("Les doublons trouvés dans la liste sont:", DuplicateVar)

Lorsque ce code est exécuté, il produit le résultat suivant sur votre terminal:

Comme vous pouvez le voir sur la sortie, les valeurs «46» et «11» étaient présentes deux fois chacune.

Méthode 3: Utilisation de la compréhension de la liste avec une condition si

Une autre méthode pour trouver des doublons dans une liste consiste à utiliser la compréhension de la liste et à appliquer la condition si.

Prenez l'extrait de code suivant pour cette méthode:

listvar = [123,46,11,78,334,46,98,11,90]
uniquelistvar = []
duplicateListvar = []
Pour X dans Listvar:
Si x pas dans Uniquelistvar:
uniquelistvar.Ajouter (x)
autre:
duplicatelistvar.Ajouter (x)
Print ("La liste des éléments uniques est:", Uniquelistvar)
Print ("Les doublons trouvés dans la liste sont:", DuplicateListvar)

Dans cet extrait de code:

  • Deux nouvelles listes sont créées, une pour stocker chaque valeur unique et une pour stocker chaque valeur répétée / duplicata
  • Chaque élément est vérifié par rapport aux valeurs stockées à l'intérieur de la liste des valeurs uniques, et si elle n'y existe pas déjà, il y a déjà annexé.
  • S'il existe déjà là-bas, il est ajouté à la liste des valeurs en double.
  • À la fin, imprimez les deux listes sur le terminal à l'aide de la méthode print ()

Lorsque ce code est exécuté, il produit le résultat suivant sur votre terminal:

D'après la sortie, on peut voir que les valeurs «46» et «11» étaient des doublons et, par conséquent, une seule de leurs instances est laissée dans la liste des valeurs uniques.

Conclusion

Pour trouver des doublons dans une liste, l'utilisateur peut utiliser différentes approches qui incluent la conversion de la liste en une chaîne, en utilisant la compréhension de la liste avec la méthode Count (), ou en utilisant la condition If-Not-in avec la compréhension de la liste. Cependant, la méthode la plus rapide pour supprimer les doublons de la liste est la conversion de la liste en un ensemble.