Comment itérer sur les lignes dans une fragmentation des données en pandas

Comment itérer sur les lignes dans une fragmentation des données en pandas
L'itération est une méthode qui nous aide à traverser toutes les valeurs. Dans Pandas, lorsque nous créons un dataframe, nous devons toujours accéder aux valeurs et où l'itération aide. Ainsi, dans cet article, nous allons passer en revue différentes méthodes pour l'itération sur le plan des lignes de données.

pandas.Trame de données

Un Pandas DataFrame peut être créé à l'aide du constructeur suivant:

pandas.DataFrame (data = non, index = non, colonnes = aucun, dType = aucun, copy = false)

Méthode: Utilisation de l'attribut d'index du DataFrame

Nous avons créé un dictionnaire de données avec quatre clés, puis avons converti ce dictionnaire de données en DataFrame à l'aide de la bibliothèque Pandas comme indiqué ci-dessous:

Dans le numéro de cellule [4], nous imprimons simplement ce DataFrame pour voir à quoi ressemble notre dataframe:

Dans le numéro de cellule [5], nous affichons ce que l'index réel a des informations sur le dataframe. La sortie montre que l'index stocke les détails des lignes totales de DataFrame sous forme de plage, comme indiqué ci-dessus dans la sortie.

Dans le nombre de cellules [6], comme nous le savons déjà, l'index stocke la fonction de plage, qui a des valeurs de 0 à 4 (la dernière valeur n'a pas été comptée de sorte que la boucle fonctionne de 0 à 3). Nous allons donc la boucle comme d'habitude, et à chaque itération, elle ira à ce nom de colonne particulier qui est mentionné comme df ['name'], puis imprimera la valeur d'index (numéro de ligne) de cette colonne particulière de cette colonne.

Méthode: en utilisant la fonction loc [] du dataframe

Comprenons d'abord la méthode LOC et ILOC. Nous avons créé une série_df (série) comme indiqué ci-dessous dans le numéro de cellule [24]. Ensuite, nous imprimons la série pour voir l'étiquette d'index avec les valeurs. Maintenant, au numéro de cellule [26], nous imprimons la série_df.loc [4], qui donne la sortie C. Nous pouvons voir que l'étiquette d'index à 4 valeurs est c. Donc, nous avons obtenu le bon résultat.

Maintenant au numéro de cellule [27], nous imprimons la série_df.Iloc [4], et nous avons obtenu le résultat e qui n'est pas l'étiquette d'index. Mais c'est l'emplacement d'index qui compte de 0 à la fin de la ligne. Donc, si nous commençons à compter à partir de la première ligne, alors nous obtenons e à l'emplacement de l'index 4. Donc, maintenant nous comprenons comment ces deux fonctionnaires similaires LOC et ILOC.

Maintenant, nous allons utiliser le .Méthode LOC pour itérer les lignes d'un dataframe.

Dans le numéro de cellule [7], nous imprimons simplement le dataframe que nous avons créé auparavant. Nous allons également utiliser le même dataframe pour ce concept.

Dans le numéro de cellule [8], alors que l'étiquette d'index part à partir de zéro (0), nous pouvons itérer chaque ligne et obtenir les valeurs de chaque étiquette d'index de chaque colonne particulière comme indiqué dans l'image ci-dessus.

Méthode: Utilisation de la méthode iTerrows () du DataFrame

Comprenons d'abord le iterrows () et voyons comment ils impriment les valeurs.

Dans Numéro de cellule [32]: Nous avons créé un DataFrame DF_TEST.

Dans le numéro de cellule [33 et 35]: nous imprimons notre DF_Test afin que nous puissions voir à quoi il ressemble. Ensuite, nous le boucle sur le iTerrows () et imprime la ligne, qui imprime toutes les valeurs avec leurs noms de colonne côté gauche.

Dans le numéro de cellule [37], lorsque nous imprimons la ligne en utilisant la méthode ci-dessus, nous obtenons les noms de colonne sur le côté gauche. Cependant, lorsque nous mentionnons déjà le nom de la colonne, nous obtenons des résultats comme indiqué dans le numéro de cellule [37]. Maintenant, nous comprenons clairement que cela iratera en termes de lignes.

Dans le numéro de cellule [9]: nous imprimons simplement le dataframe que nous avons créé avant. Nous allons également utiliser le même dataframe pour ce concept.

Dans le numéro de cellule [10]: nous allons par intéride chaque ligne en utilisant le iTerrows () et imprimez le résultat.

Méthode: Utilisation de la méthode ITERtuples () du DataFrame

La méthode ci-dessus est similaire à Iterrows (). Mais la seule différence est la façon dont nous accédons aux valeurs. Dans le numéro de cellule [11], nous pouvons voir que pour accéder à la valeur de la colonne sur chaque itération. Nous utilisons la ligne. Nom (opérateur de points).

Méthode: Utilisation de la fonction ILOC [] du DataFrame

Nous avons déjà expliqué avant comment le .La méthode ILOC fonctionne. Alors maintenant, nous allons utiliser cette méthode directement pour itérer les lignes.

Dans le numéro de cellule [18]: Nous imprimons simplement le DataFrame, que nous avons créé auparavant pour ce concept.

Dans le numéro de cellule [19]: DF.Iloc [i, 0], dans lequel j'appartiens à l'emplacement et à la valeur suivante 0, qui indique l'index du nom de la colonne.

Méthode: itérez sur les lignes et imprimez avec leurs noms de colonnes

Dans le numéro de cellule [20]: Nous imprimons simplement le DataFrame (DF), que nous avons créé auparavant pour comprendre le concept.

Dans le numéro de cellule [21]: nous itérons à travers la méthode itertuples (), que nous avons déjà expliquée. Mais si nous n'avons mentionné aucune autre information, nous obtenons la sortie avec leurs noms de colonne.

Conclusion:

Aujourd'hui, nous apprenons différentes méthodes pour ramener l'itéré sur le Pandas DataFrame. Nous avons également appris sur .loc et .Méthodes ILOC et la différence étroite entre eux. Nous avons également étudié les méthodes iterrows () et itertuples (). Nous avons également vu la méthode d'attribut d'index. Toutes ces méthodes ci-dessus ont leurs avantages et inconvénients respectifs. Ainsi, nous pouvons dire que cela dépend de la situation que la méthode lorsqu'il doit utiliser.