Pandas nlag

Pandas nlag
Le «Pandas» est la bibliothèque qui nous aide à effectuer plusieurs tâches facilement et efficacement. Nous pouvons utiliser la bibliothèque «Pandas» chaque fois que nous devons manipuler et analyser les données. «Pandas» offre également la possibilité de créer le dataframe. Le dataframe est généré à l'aide de la méthode «pandas». Nous pouvons également trouver la plus grande valeur des colonnes de DataFrame. Lorsque nous entrons dans certaines données numériques dans la colonne de DataFrame, nous trouvons également les valeurs les plus importantes présentes dans cette colonne à l'aide de la méthode «Pandas». La méthode que nous pouvons utiliser pour trouver les valeurs les plus importantes dans les colonnes du DataFrame est la méthode «nlagg ()». Nous utiliserons cette méthode «nla plus» dans les codes «pandas» de ce guide et expliquer son travail ici.

Syntaxe:
Trame de données.nlagg (n, colonnes, keep = "premier")

Le «N» représente le nombre des plus grandes valeurs que nous voulons obtenir des colonnes de DataFrame. Ensuite, à la place du paramètre «colonnes», nous mettons le nom de la colonne à partir de laquelle nous voulons obtenir les valeurs les plus importantes. Ensuite, dans le paramètre «Keep», nous pouvons ajouter «d'abord» ou «dernier». Le «premier» est utilisé pour afficher la première valeur des valeurs dupliquées et le «dernier» est utilisé pour afficher la dernière valeur des valeurs en double.

Exemple 1:

Le code initial de ce guide est ici. Tous les scripts que nous couvrons dans ce guide sont effectués à l'aide de l'outil «Spyder». Nous importons quelques modules «pandas» chaque fois que nous souhaitons écrire un nouveau code «pandas». Ceux-ci peuvent être importés en écrivant simplement les «pandas en tant que PD» après le mot-clé «import», ce que nous faisons ici. Maintenant, en insérant le «PD» dans ce code, nous obtenons un accès aux fonctions de «pandas». Maintenant, nous concevons le dataframe ici en mettant «PD.Trame de données()".

Nous concevons le dataframe «num_df» et y mettons trois colonnes dedans. Le «cola» est la première colonne que nous créons dans ce dataframe. Le «cola» a «10, 4, 6, 9 et 18». Après «Cola», nous ajoutons la deuxième colonne «Colb» dans laquelle nous ajoutons également quelques nombres qui sont «13, 28, 48, 12 et 11». Ensuite, la dernière colonne que nous insérons ici est la colonne «colc». Dans la colonne «COLC», nous avons mis «21, 24, 31, 44 et 59». Toutes les colonnes ainsi que certaines données sont insérées dans le dataframe «num_df».

Maintenant, nous utilisons le «print ()» et passons «num_df» à cette fonction. Cela affiche le «num_df» sur le terminal. Nous voulons obtenir les trois valeurs les plus importantes de la colonne «cola» de ce dataframe. Ainsi, à cette fin, nous utilisons la méthode «nlaggest ()» et passons «3» comme premier paramètre qui représente le nombre des plus grandes valeurs que nous voulons obtenir. Ensuite, nous écrivons «cola» parce que nous voulons obtenir les valeurs les plus importantes de la colonne «cola» et stocker ces valeurs les plus importantes dans la «grande» variable. Ensuite, nous imprimons ces valeurs. Ainsi, nous utilisons à nouveau «print ()» qui contient la «grande» variable. Ces trois plus grandes valeurs de «cola» sont affichées sur le terminal.

Après avoir frappé les touches «Shift + Entrée» ou appuyé sur l'icône Run, nous pouvons facilement obtenir le résultat des codes «Pandas» dans le «Spyder». Le DataFrame est ici dans ce résultat qui contient toutes les données que nous y ajoutons. Ensuite, dans le dataframe suivant, trois lignes sont affichées. Ce sont les «3» plus grandes valeurs du «cola» qui sont rendues ici par ordre décroissant.

Exemple 2:

Le «gym_df» est conçu dans ce code où nous ajoutons le «poids_loser» et les «poids» comme colonnes. Dans la chronique «poids_loser», «Theo, Harper, Oscar, Sue, Grace, Jayden, Larry et Taylor» sont ajoutés. Ensuite, nous avons la colonne «poids» où nous mettons les poids qui sont «99, 101, 119, 89, 102, 85, 86 et 120». Maintenant, nous appelons le «print ()» et fournissons l'argument «gym_df». Cela fait que le terminal montre le «gym_ df». Nous voulons obtenir le «4» plus grand nombre de la colonne «poids» de ce dataframe.

Pour y parvenir, nous utilisons la méthode «nlaggest ()» et passons le nombre «4» comme premier paramètre, qui représente le nombre des valeurs les plus importantes que nous voulons obtenir. Ensuite, nous tapons «poids» pour acquérir la plus grande valeur de la colonne «poids». Nous économisons également ces valeurs les plus importantes dans la variable «grande_onde». Les valeurs doivent ensuite être imprimées. Par conséquent, nous utilisons à nouveau le «print ()». Il comprend la variable «grande_wemblers». Le terminal montre les «poids» les quatre valeurs les plus importantes.

Après les données d'origine, les quatre plus grandes valeurs de la colonne «poids» sont affichées sous la forme d'une autre nouvelle DataFrame. Nous obtenons ces quatre valeurs les plus importantes en utilisant la méthode «nlaggest ()» de «pandas» dans le code.

Exemple 3:

Dans cet exemple, nous lisons le fichier CSV à l'aide de la méthode "read_csv" de "pandas" et créons le dataframe à partir du fichier CSV. Nous stockons cette variable DataFrame dans la variable "data_df". Maintenant, nous utilisons la méthode «dropna ()» où nous ajustez le paramètre «InPlace» à «True». Cela supprime ces lignes où la valeur nulle apparaît. Après cela, nous obtenons la méthode «nlaggest ()» et ajoutons «5» parce que nous voulons obtenir les cinq premières valeurs les plus importantes de la colonne «Unités». Ces cinq valeurs les plus importantes sont stockées dans la variable «plus grande 5». Ce «plus grand 5» est placé dans le «print ()» pour afficher.

Il affiche toutes les données du fichier CSV ici comme le DataFrame après l'avoir lu. Ensuite, il obtient les cinq premières valeurs les plus importantes d '«unités» et les déplace dans ce résultat.

Exemple 4:

Ce code crée le «Sales_df» et ajoute les colonnes «Salesman» et «Sales / Day». «ABC, ABD, ABE, ABF, ABG, ABH, ABI, ABJ, ABK et ABL» sont maintenant répertoriés dans la colonne «Salesman». La colonne «Sales / Day» suit où nous énumérons les prix de vente suivants: «60000, 25000, 30000, 18000, 29000, 21000, 40000, 54000, 33000 et 41000». Maintenant, nous placons le "print ()" avec l'argument "Sales_df". Cetframe de données «Sales_DF» apparaît dans le terminal en conséquence. Les «4» plus grands chiffres de la colonne «Sales / Day» de ce DataFrame sont ce que nous désirons obtenir de ce DataFrame.

La méthode «nlagg ()» est utilisée pour le faire. Le premier paramètre qui représente le nombre des valeurs les plus importantes que nous souhaitons recevoir est «4», qui est ajouté ici. Ensuite, nous ajoutons le nom de la colonne à partir de laquelle nous voulons accéder aux valeurs les plus importantes. Le nom de cette colonne est la colonne «Sales / Day». Nous ajoutons cette méthode «nlaggest ()» dans le «print ()», il est donc également affiché sur le terminal.

Ce résultat contient le dataframe avec toutes les données que nous y avons contribuées dans le code. Ensuite, quatre lignes sont affichées dans le dataframe suivant. Ce sont les «4» plus grandes valeurs de la colonne «Sales / Day». Ils sont affichés par ordre décroissant dans l'illustration suivante:

Conclusion

Ce guide a entièrement décrit la méthode «nlaggest ()» de «pandas» en détail. Nous avons appris la syntaxe de ce guide en détail ainsi que l'utilisation de cette méthode. Nous avons discuté des paramètres de cette méthode en profondeur et nous avons également utilisé cette méthode «nlaggest ()» dans le code «pandas» pour montrer le fonctionnement de cette méthode «nlagg ()». Nous avons expliqué comment mentionner le nombre des plus grandes valeurs que nous voulons obtenir ainsi que le nom de la colonne pour obtenir les plus grandes valeurs «N» de la colonne de DataFrame. Nous avons également expliqué comment obtenir les valeurs les plus importantes du fichier CSV après avoir lu les données du fichier CSV dans ce guide.