Pour effectuer une analyse appropriée, nous devons compter le nombre de lignes et de colonnes car elles peuvent nous aider à connaître la fréquence ou l'occurrence de vos données.
Dans cet article, nous allons voir cinq types différents de façons qui peuvent nous aider à compter le nombre total de lignes et de colonnes en utilisant la bibliothèque Pandas.
- En utilisant la méthode de forme
- Utilisation du Len (DF.Axes) Méthode
- En utilisant le dataframe.index (lignes) et dataframe.Colonnes
- Utilisation de la méthode à l'aide de DF.Info( )
- Utilisation de la méthode à l'aide de DF.compter()
Méthode 1: Utilisation de la méthode de forme
La première méthode pour calculer les lignes et les colonnes est la méthode de forme. Comme nous le savons, la méthode de forme est utilisée pour obtenir la hauteur et la largeur de la table. La forme nous donne le résultat en forme de tuple avec deux valeurs. Dans ces deux valeurs, la première valeur du tuple appartient à la hauteur et l'autre valeur (deuxième valeur) appartient à la largeur du tableau.
Ainsi, la même technique peut également être utilisée dans le dataframe car le dataframe lui-même est un tableau qui a des lignes et des colonnes.
- Dans le nombre de cellules [1]: Importez la bibliothèque Pandas en tant que PD.
- Dans le nombre de cellules [2]: Nous avons créé un objet Dict (Dictionary), puis convertir cet objet Dict en un DataFrame à l'aide de la bibliothèque Pandas.
- Dans le nombre de cellules [3]: Nous imprimons le dict converti à DataFrame (DF).
- Dans le nombre de cellules [4]: Nous imprimons simplement la forme pour vérifier quelle valeur il stocke. Nous avons des valeurs égales aux lignes (4) et aux colonnes (3).
- Dans le nombre de cellules [5]: Ainsi, nous pouvons maintenant imprimer le nombre de lignes du DF (DataFrame) en utilisant la forme [0] qui appartient à la première valeur du tuple et des colonnes en utilisant la forme [1] qui appartient à la deuxième valeur du tuple. Le même individuellement, nous imprimons le résultat du numéro de cellule [6] pour les lignes et les colonnes dans le numéro de cellule [7].
Méthode 2: Utilisation du len (df.Axes) Méthode
La prochaine méthode que nous allons utiliser est le DF.Méthode des axes. Le DF.La méthode des axes est quelque peu similaire à la méthode de forme. Mais la principale différence est que la méthode de forme donnera des résultats directs des lignes et des colonnes sous forme de tuple. Mais le DF.Axes Si nous imprimons comme indiqué dans le numéro de cellule [52] ci-dessous, qui stocke les valeurs d'index des lignes et des colonnes.
- Dans le nombre de cellules [50]: Nous avons créé un objet Dict (Dictionary), puis convertir cet objet Dict en un DataFrame à l'aide de la bibliothèque Pandas.
- Dans le nombre de cellules [51]: Nous imprimons le dict converti à DataFrame (DF).
- Dans le nombre de cellules [52]: Nous imprimons le DF.Axes pour voir ce qu'ils stockent les valeurs. On peut voir le DF.Axes Stockez les valeurs d'index des lignes et des colonnes.
- Dans le nombre de cellules [53]: Maintenant, nous comptons le nombre de lignes en utilisant le len (df.Méthode des axes [0]) comme indiqué ci-dessus. La valeur 0 appartient à l'index de ligne.
- Dans le nombre de cellules [54]: Nous calculons le nombre de colonnes en utilisant le len (df.Axes [1]). La valeur 1 appartient à l'index de la colonne.
Méthode 3: Utilisation du dataframe.index (lignes) et dataframe.Colonnes
La prochaine méthode que nous allons utiliser est DataFrame.index (lignes) et dataframe.Colonnes. Cette méthode est également similaire à la méthode ci-dessus (DF.axes) dont nous avons déjà discuté. Mais pour récupérer les lignes et les colonnes, le chemin est différent, ce que vous verrez ci-dessous.
- Dans le nombre de cellules [55]: Nous avons créé un objet Dict (Dictionary), puis convertir cet objet Dict en un DataFrame à l'aide de la bibliothèque Pandas.
- Dans le nombre de cellules [56]: Nous imprimons le dict converti à DataFrame (DF).
- Dans le nombre de cellules [57]: Nous imprimons le DF.Index pour voir ce qu'ils ont des valeurs. Nous avons trouvé dans le résultat que le DF.L'index a tout le nombre d'index du début à la fin de la ligne.
- Dans le nombre de cellules [58]: Nous imprimons le DF.colonnes et a constaté qu'il a tous les noms de colonnes.
- Dans le nombre de cellules [59]: Nous calculons ensuite l'index (lignes) en utilisant le len (df.index) Méthode comme indiqué ci-dessus dans le numéro de cellule [59] et attribuez la valeur à une ligne variable. Et similaire, nous faisons le nombre pour les colonnes et attribuons cette valeur à une autre variable Cols.
- Dans le nombre de cellules [60]: Nous imprimons les deux variables (lignes et cols) et obtenons respectivement les résultats 4 et 3.
Méthode 4: Utilisation de la méthode à l'aide de DF.Info( )
La prochaine méthode dont nous allons discuter pour compter les lignes et les colonnes est DF.Info ( ). Cette méthode est un peu délicate, ce qui signifie que vous n'obtiendrez pas les lignes et les colonnes car nous avons vu des résultats directement dans la méthode précédente. La raison derrière cela est que lorsque nous exécutons cette méthode, nous obtenons les valeurs des lignes et des colonnes ainsi que d'autres informations sur DataFrame comme vous le verrez dans le résultat ci-dessous.
- Dans le nombre de cellules [61]: Nous avons créé un objet Dict (Dictionary), puis convertir cet objet Dict en un DataFrame à l'aide de la bibliothèque Pandas.
- Dans le nombre de cellules [62]: Nous imprimons le dict converti à DataFrame (DF).
- Dans le nombre de cellules [63]: Nous imprimons le DF.info () et a obtenu toutes les informations sur le dataframe avec le nombre total de lignes et de colonnes. Donc, les astuces ici sont que nous devons filtrer le résultat pour obtenir les lignes et les colonnes du DataFrame.
Méthode 5: Utilisation du DF.Méthode count ()
La méthode de comptage suivante dont nous allons discuter est df.compter( ). Cette méthode peut être utilisée pour compter les lignes et les colonnes. Pour compter le nombre total de lignes, nous utilisons le DF.Méthode count () et pour les colonnes, nous utilisons le DF.count (axe = 'colonnes').
- Dans le nombre de cellules [64]: Nous avons créé un objet Dict (Dictionary), puis convertir cet objet Dict en un DataFrame à l'aide de la bibliothèque Pandas.
- Dans le nombre de cellules [65]: Nous imprimons le dict converti à DataFrame (DF).
- Dans le nombre de cellules [66]: Nous imprimons le DF.count () pour vérifier le nombre total de lignes et obtenir le résultat sous forme de dénombrement car il ne comptera pas la valeur nul. Il est un peu difficile d'obtenir le résultat approprié, donc les gens ne choisissent pas cette méthode.
- Dans le nombre de cellules [67]: Nous comptons les colonnes en utilisant Theas DF.count (axe = 'colonnes').
Conclusion
Nous avons donc vu différents types de méthodes pour compter les lignes et les colonnes. Dans lequel la meilleure méthode est l'index et la forme car ils donneront le résultat instantané du nombre total des lignes et des colonnes, et nous n'avons pas à effectuer un travail supplémentaire comme nous l'avons vu dans les autres méthodes comme DF.count () et df.Info().