Pandas Agg Count

Pandas Agg Count
Dans "Pandas", nous pouvons créer les dataframes qui contiennent les ROWS_AND_COLUMNS. De grandes quantités de données tabulaires sont généralement explorées et organisées à l'aide du programme PANDAS. «Pandas» nous fournit plusieurs méthodes et l'une d'elles est le «nombre», nous pouvons voir combien de valeurs il y a pour chaque colonne de votre dataframe en utilisant la méthode de nombre.

La méthode du nombre est utilisée pour localiser des colonnes incomplètes. De là, vous pouvez choisir de sauter les colonnes dans vos processus ou, si nécessaire, leur donner des valeurs par défaut. Dans ce guide, nous examinerons les Pandas Count et Value_Counts qui sont deux façons d'évaluer votre DataFrame.

Exemple # 01

Nous commençons par utiliser l'application «Spyder». Cela nous aidera à faire les codes «pandas». Sur son éditeur de texte, nous commençons notre premier code en important les «Pandas en tant que PD». Ce «PD» est utilisé pour accéder aux méthodes «pandas» que nous voulons. Maintenant, nous n'avons pas besoin d'écrire le nom complet «Pandas» pour accéder à sa fonction. Au lieu de cela, nous écrivons simplement «PD».

Nous créons ensuite une variable et l'initialisons également en ajoutant des données. Nous ajoutons les données dans la colonne en définissant le premier nom de colonne comme «noms» et les noms que nous ajoutons ici sont «Ray», «James», «Mole», «Smith», «Jay», «Milli», «William» , et "Rick". La colonne suivante est nommée «matières» qui contient des noms de matières tels que «mathématiques», «économie», «science», «mathématiques», «statistiques», «statistiques», «statistiques» et «ordinateur».

Sous la variable, nous créons «numéro» et nous utilisons le «PD.Méthode DataFrame () ». Nous utilisons le «PD» pour obtenir la méthode Pandas «DataFrame». Nous transformons les données «cours» en «DataFrame» et mettons à jour son nom comme «numéro». Ensuite, la méthode «print ()» aide à afficher le dataframe. En dessous, nous utilisons d'abord la méthode «groupby ()». Il nous permet de diviser vos données en de nombreuses catégories afin que vous puissiez exécuter des calculs pour une analyse plus approfondie. Nous «groupby» ce dataframe en mettant des «sujets», puis utilisons la méthode «count ()».

La fonction Count () donne une entité de série avec le résultat pour chaque ligne après avoir compté le nombre de valeurs non vides pour chaque ligne. Nous mettons les deux méthodes dans la fonction «print ()» afin qu'elle soit affichée sur le terminal.

Il affiche d'abord le dataframe d'origine, puis «groupby» sujets et compte le nombre du sujet. Il ajoute également les mêmes sujets et l'écrit ici. Dans ce Dataframe, deux colonnes contiennent le sujet «mathématiques», il affiche donc les «mathématiques» «2» et le sujet «statistiques» «3».

Exemple # 02

Maintenant, nous importons «Pandas», puis générons des données et stockons ces données dans la variable «Data123». Nous avons ici des colonnes «employés» et «adresse». Dans «Employee», nous insérons les noms d'employés qui sont «Ray», «James», «Mole», «Smith», «Jay», «Milli», «William» et «Rick». Dans «l'adresse», nous mettons les adresses des employés qui sont «Londres», «Amérique», «Sodan», «Londres», «Sodan», «Sodan», «Amérique» et «Amérique».

Ensuite, nous déclarons et initialisons également «même» qui est un nom de variable et l'initialisons avec «PD.Trame de données". Nous passons également le paramètre «Data123» à ce «PD.Trame de données". Nous utilisons la méthode "Value_Count ()" ci-dessous. La technique du nombre de valeurs est meilleure. Cette technique donnera le nombre total de valeurs distinctes pour une colonne donnée. Nous donnons la colonne «Adresse» ici.

Nous avons le nom de DataFrame qui est «le même» et ajoutant le nom de la colonne qui est «Adresse». Ensuite, écrivez la fonction ou la méthode "Value_Count ()". Nous ajoutons cette déclaration complète dans la méthode «print ()» afin qu'elle soit également sur l'écran de la console.

Après avoir rendu le dataframe dans ce résultat, il compte les mêmes adresses des employés et les affiche ci-dessous et supprime le nom des employés ou supprime la colonne «Employee». Il montre simplement l'adresse et leurs nombres qui sont présents dans ce DataFrame.

Exemple # 03

Les données ici sont insérées en cinq colonnes. Nous créons une dataframe nommée «étudiants» et les colonnes que nous avons sont «roll_no», «s_name», «s_instructor», «s_course» et «Credit_Hrs». Dans la colonne «roll_no», nous avons «A1, A2, A3, A4 et A5». Maintenant, dans la colonne suivante «S_NAME», nous ajoutons les noms des étudiants «Smith, Noah, Joseph, Mishi et William». Ensuite, nous mettons les noms de l'instructeur: "Peter, Taylor, James, Robert et Olivia". Les cours que nous insérons ici sont «anglais, britannique, anglais, arabe et anglais».

Pour la colonne «Credit_Hrs», nous y ajoutons «4, 5, 4, 3 et 4». Nous modifions toutes ces données dans le dataframe et nommez cette dataframe ou stockons cette variable DataFrame dans la variable «étudiants». Ensuite, nous employons «print ()» qui rend ce dataframe. En dessous, nous plaçons les méthodes «groupby ()» et «count ()». Et mettez «S_Couse» pour qu'il compte les cours et les affiche.

Nous avons 1 cours «arabe», 1 cours «britannique» et 3 cours «anglais» ici dans ce dataframe. Nous obtenons ce décompte en appliquant la méthode «count ()».

Exemple # 04

Dans cet exemple, le dataframe créé contient le "upload_date" dans lequel nous ajoutons quelques dates qui sont ajoutées à cinq dates. Ensuite, insérez une autre colonne «Viewer_IDS» dans laquelle nous ajoutons les ID des téléspectateurs comme «V1, V2, V3, V4 et V5». Nous donnons le nom «vidéo» à ce dataframe. Utilisez d'abord «groupby» qui regroupe les données en fonction de «upload_date», puis utilise le «count ()» qui comptera ces données sur la base de «upload_time». Enfin, affichez le résultat.

Ceci est le résultat de ce code et il compte les données en fonction du «temps de téléchargement» des vidéos. Les vidéos qui sont téléchargées sur «2022-07-21» sont deux dans le nombre total de comptes.

Exemple # 05

L '«étude» est la variable contenant des données qui sont sous forme de colonne et de lignes. Les noms de colonne sont des «cours, c_fee et c_duration». La colonne «Cours» a «Pandas, Ubuntu, Linux, Python, Pandas, Linux, Spark, Python, Ubuntu, Python et Python». La colonne «C_FEE» contient «22000, 25000, 23000, 24000, 26000, 25000, 25000, 22000, 25000, 24000 et 24000». La colonne «C_Duration» contient des données qui sont «30 jours, 50 jours, 35 jours, 40 jours, 60 jours, 35 jours, 30 jours, 50 jours, 50 jours, 40 jours et 40 jours».

Changez-les dans DataFrame et imprimez également le DataFrame. «Groupby ()» les «cours et c_duration» et les compter en appliquant «count ()». Ces méthodes «Groupby» et «Count» regroupent les données en fonction des colonnes pour les cours et la durée. Ensuite, calculez le nombre.

Ici, il regroupe les données sur les cours et leur durée, puis compte ces cours en utilisant la méthode «count ()».

Conclusion

Ce guide est sur le concept de la fonction «comptage d'agriculture» dans «Pandas."Nous avons décrit comment la fonction« comptage d'agriculture »dans les pandas est utilisée pour compter. La méthode du «nombre d'agglages» a été appliquée aux cinq instances que nous avons établies.