Les pandas obtiennent la valeur la plus fréquente

Les pandas obtiennent la valeur la plus fréquente
Le but de cet article est de montrer la valeur la plus fréquente dans un ensemble de nombres. Pour résumer le nombre de fois qu'un élément ou un nombre apparaît, la fonction Value_Coutets () de Python est utilisée. La méthode Mode () peut ensuite être utilisée pour obtenir l'élément le plus souvent présent. Si vous voulez différentes façons d'obtenir les valeurs les plus fréquentes à Python, cet article a toutes les directives.

Quelle est la méthode Value_Coutets () dans Python?

Les valeurs uniques d'un objet Pandas sont comptées à l'aide de la méthode du nombre de valeurs (). Dans Python, nous utilisons généralement cette technique pour la querelle de données ainsi que l'exploration des données.

La méthode Value_Coutets () peut fonctionner avec une variété d'objets Pandas. Les séries Pandas, les colonnes Pandas Dataframes et DataFrame en sont des exemples (qui sont des objets de la série Pandas).

Cependant, en fonction du type d'objet avec lequel vous travaillez, la façon dont vous implémentez la méthode Value_Coutets () diffère légèrement.

D'autres arguments facultatifs peuvent être utilisés pour modifier la fonctionnalité de la méthode Value_Counts ().

Syntaxe de la fonction de la série Pandas ()

Dans une série Pandas, la valeur la plus courante est simplement le mode de la série. La méthode Pandas Series Mode () est utilisée pour acquérir des informations sur le mode. La syntaxe est la suivante. Les modes de la série sont retournés dans l'ordre trié.

# df ['colonne'].mode()

Syntaxe de Pandas Value_Counts () Fonction

Pour récupérer la valeur de comptage la plus élevée, utilisez les fonctions Pandas Value_Counts () et IdxMax () simultanément. La syntaxe est la suivante:

# df ['colonne'].Value_Counts ().idxmax ()

Voyons maintenant quelques exemples pratiques pour voir comment vous pouvez obtenir les valeurs les plus fréquentes en suivant les étapes.

Exemple 1:

Nous devons d'abord établir le dataframe avant de passer aux étapes de détermination de la valeur la plus fréquente avec mode (). Ceci est un DataFrame avec un champ de catégorie que nous utiliserons pour le reste du tutoriel. Le DataFrame 'D_Frame' contient les noms ('Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill') et les informations d'équipe ('A', 'B', '', ' C ',' d ',' e ',' a ',' b ',' a ',' b ',' a '). La colonne «Team» de DataFrame est un champ de catégorie avec des valeurs indiquant l'équipe affectée à chaque étudiant.

Le module Pandas est importé au début du code dans le code de référence ci-dessous. Le dataframe est ensuite généré et présenté à l'écran.

importer des pandas
d_frame = pandas.Trame de données(
«Nom»: [«Kim», «Kourtney», «Scott», «Rob», «Kendall», «Gathie», «Phill»],
«Team»: [«A», «B», «C», «D», «E», «A», «B»]
)
print (d_frame)

Dans l'image ci-dessous, les noms des étudiants sont affichés avec le nom de l'équipe auquel ils ont été affectés.

Nous vous montrerons comment utiliser la fonction Mode () pour déterminer la valeur la plus fréquente. Le mode, qui est une statistique descriptive, est essentiellement la valeur la plus courante dans l'ensemble de données. Cela vous donnera des informations sur l'équipe qui compte le plus d'étudiants.

Nous avons d'abord importé le module Pandas et généré le DataFrame, comme vous pouvez le voir dans le code. Les noms des étudiants et de l'équipe sont inclus dans le dataframe.

importer des pandas
d_frame = pandas.Trame de données(
«Nom»: [«Kim», «Kourtney», «Scott», «Rob», «Kendall», «Gathie», «Phill»],
«Team»: [«A», «B», «C», «D», «E», «A», «B»]
)
print (d_frame ['team'].mode())

Il donne une série Pandas plus le mode de la colonne. Parce que «A» et «B» sont les valeurs les plus fréquentes dans le champ «Team», nous obtenons «A» et «B» comme mode.

Veuillez noter que vous pouvez acquérir le mode de chaque colonne dans un Pandas DataFrame en utilisant la méthode Mode ().

Exemple 2:

Nous vous montrerons comment utiliser Value_Counts () pour obtenir la valeur la plus fréquente de cet exemple. La fonction Value_Countts () peut être utilisée pour obtenir des dénombrements, puis la fonction idxMax () peut être utilisée pour obtenir la valeur avec le plus.

Le reste du code, à l'exception de la dernière ligne, est identique à celui ci-dessus. Il montre comment la fonction (Value_Counts) est utilisée pour découvrir la valeur avec le nombre le plus élevé.

importer des pandas
d_frame = pandas.Trame de données(
«Nom»: [«Kim», «Kourtney», «Scott», «Rob», «Kendall», «Gathie», «Phill»],
«Team»: [«A», «B», «C», «D», «E», «A», «A»]
)
print (d_frame ['team'].Value_Counts ().idxMax ())

Voir l'écran résultant ci-dessous. Nous obtenons la valeur dans la colonne «Team» avec le nombre de valeurs maximales.

Exemple 3:

Cet exemple démontrera ce qui se passera si le DataFrame contient les valeurs les plus fréquentes. Changeons le dataframe afin que la colonne «Team» contient des modes répétés. Nous changeons la valeur «Rob» de «l'équipe» de «D» à «B» ici.

importer des pandas
d_frame = pandas.Trame de données(
«Nom»: [«Kim», «Kourtney», «Scott», «Rob», «Kendall», «Gathie», «Phill»],
«Team»: [«A», «B», «C», «D», «E», «A», «F»]
)
d_frame.à [3, 'Team'] = 'B'
print (d_frame)

Nous avons maintenant des modes récurrents, comme vous pouvez le voir. «A» apparaît deux fois dans la colonne «Team» dans notre scénario.

Le nom de l'équipe de l'étudiant «Rob» est passé de «D» à «A» dans l'image qui l'accompagne.

Exemple 4:

Voyons ce que la valeur compte () et idxmax () les méthodes renvoient. Nous avons mis à jour les valeurs DataFrame dans cet exemple de code. Notez que l'équipe «A» et «B» apparaissent deux fois. Après cela, nous avons utilisé la valeur.Fonctions Counts () et idxMax () pour déterminer la valeur la plus courante dans le dataframe. Voici le code de référence.

importer des pandas
d_frame = pandas.Trame de données(
«Nom»: [«Kim», «Kourtney», «Scott», «Rob», «Kendall», «Gathie», «Phill»],
«Team»: [«A», «B», «C», «D», «E», «A», «B»]
)
print (d_frame ['team'].Value_Counts ().idxMax ())

Veuillez noter que même s'il existe de nombreux modes, cette méthode ne renvoie qu'une seule valeur. Cela s'est produit parce que la fonction idxmax () ne fournit qu'un seul résultat - «Si plusieurs valeurs correspondent au maximum, le titre à une rangée avec cette valeur est renvoyé.«Pour récupérer la valeur la plus courante dans une série Pandas, vous devez appliquer la fonction« Mode () »de la série Pandas.

Conclusion:

Dans cet article, nous avons examiné comment trouver la valeur la plus fréquente dans une colonne ou une série Pandas en utilisant certains exemples. Nous avons discuté d'une variété de fonctions qui peuvent être utilisées pour atteindre cet objectif. Mode (), Value Counts () et idXMax () sont quelques-unes de ces méthodes. Si vous êtes nouveau dans ce concept et que vous avez besoin d'un guide étape par étape pour commencer, allez plus loin que cet article.