Index de tri Pandas

Index de tri Pandas
«Pandas» est l'un des packages du langage Python qui analyse mieux les données. Travailler avec une énorme échelle de données est mouvementée et difficile à gérer. Comme il y a de nombreux facteurs que les données vivent, l'un d'eux est de «tri». L'un des travaux clés à terminer est le tri des données. Les pandas ont une fonction pour trier les données dans le dataframe en utilisant leurs valeurs. La fonction est Pandas «Sort_value». Cela aide à trier des millions de quantités de données en quelques minutes. En valeur de tri Pandas, les données sont triées par la sélection des colonnes dans l'ordre croissant ou descendant. Nous couvrirons tout comment les valeurs de tri Pandas peuvent être effectuées. Nous utiliserons l'outil «Spyder» pour l'implémentation du code. Il a un environnement de langue python.

Syntaxe

df.sort_values

Le «DF» dans la syntaxe est une abréviation du «DataFrame». La syntaxe ci-dessus trie la colonne par la valeur dans le dataframe. Au lieu d'utiliser l'intégralité de DataFrame, il fonctionne avec une étiquette spécifique du DataFrame. Voici les méthodes de valeur de tri Pandas que nous allons implémenter avec des exemples:

  • Valeurs de commande pandas par ordre croissant par les colonnes spécifiées.
  • Pandas Trier les valeurs par plusieurs colonnes (cas I).
  • Pandas Trier les valeurs par plusieurs colonnes (cas II).
  • Pandas trie valeurs nan au début.

Création d'un dataframe pour l'implémentation des valeurs de tri pandas dans des exemples

Après avoir ouvert le logiciel «Spyder», importez la bibliothèque Pandas comme «PD». Maintenant, commencez à créer un dataframe. Le dataframe est des données «voitures». Nous avons les noms de la marque: «BM», «US», «HC» et «ZX». Nous avons également les prix de ces voitures, en tant que «44000», «32000», «52000» et «23000» avec leur année de fabrication «2018», «2019», «2019» et «2020».

La sortie montre le dataframe créé avec les colonnes des marques automobiles, leur prix et leur année de fabrication.

Exemple 01: Valeurs de commande Pandas dans l'ordre croissant par les colonnes spécifiées

Dans cet exemple, nous utiliserons la fonction de valeur de tri Pandas pour commander les valeurs de données. Le DataFrame ici se compose des modèles de voitures sous le nom de «WW», «XX», «NN» et «TT» avec leurs prix «45000», «22000», «33000» et «55000» et leurs années de fabrication sont «2018 »,« 2019 »,« 2020 »et« 2021 ». Les valeurs de tri Pandas fonctionnent en fonction de leur sélection de colonnes spécifiée. Ici, nous ferons le tri basé sur la «marque» de la colonne comme vous pouvez le voir dans le code. Nous n'avons pas écrit l'ascension dans le code parce que vous n'avez pas à mentionner que, comme par défaut, la fonction de tri Pandas l'exécute par ordre croissant.

Le DataFrame affiche le tri de la colonne «marque» dans l'ordre croissant.

Exemple 02: Valeurs de tri pandas par colonne sélectionnée dans l'ordre descendant

Dans le dernier exemple, nous avons vu comment trier les valeurs dans l'ordre croissant. Nous ne voulons pas que les données soient toujours triées. Parfois, par demande, nous le voulons dans l'ordre descendant. Maintenant, nous allons faire comment trier les valeurs dans l'ordre descendant. Nous avons le dataframe ayant les données des voitures telles que ses marques: «yy», «qq», «pp» et «bb» avec leurs prix «38000», «45000», «22000» et «12000». Nous avons les années de fabrication ainsi que «2019», «2020», «2021» et «2020». Nous avons sélectionné la même «Marque de colonne» pour trier ses données, avec les noms en ordre décroissant en ajoutant simplement une condition «ascendant = false». Le «en place = true» dans le code est un mot-clé qui modifie le comportement par défaut dans la méthode Pandas.

La sortie montre le DF trié de la marque de colonne dans l'ordre descendant.

Exemple 03: Valeurs de tri Pandas par plusieurs colonnes (cas I)

Maintenant, nous ferons un exemple de la valeur de tri Pandas dans plusieurs colonnes. Les données que nous avons en tant que noms de marque des voitures «ll», «kk», «hh» et «gg». Leurs prix sont «45000», «14000», «13000» et «56000» et les années de fabrication sont «2019», «2020», «2021» et «2018». Ici, nous avons sélectionné la colonne «prix» et «année» car nous devons faire le tri de plusieurs colonnes. Nous avons utilisé la fonction Pandas «Sort_value» avec le «DF» et les colonnes sélectionnées pour le tri.

Ici, dans la sortie, nous pouvons voir que la colonne «prix» et «année» est triée avec succès.

Exemple 04: Valeurs de tri Pandas par plusieurs colonnes (cas II)

Dans le dernier exemple, nous avons fait le tri des données dans plusieurs colonnes. Et si les deux années ont la même «année» de fabrication? Ici, nous reconnaîtreons cette situation. Les données sont des voitures comme «xx», «bb», «ee» et «dd» avec leurs prix comme «12000», «15000», «19000» et «17000». Les années de la voiture fabriquée sont «2021», «2019», «2020» et «2020». Comme nous pouvons le voir, le «2020» est apparu deux fois dans la fabrication. Dans cette situation, quelle année devrait être la première dans les données si cette question se pose? Simplement, cela passera par l'année si les deux sont les mêmes. Ensuite, il vérifierait sa valeur de prix. Celui qui a le prix le plus bas sera le premier et le plus élevé ira après cela. Sur la base des valeurs attribuées aux données, cela fonctionnera si ce type de condition se produit. Dans le code, nous avons sélectionné la colonne «année» et «marque» pour les trier par valeur de tri pandas.

L'affichage est la valeur triée de la marque et de l'année. Ici, nous voyons que l'année «2020» apparaît deux fois; D'abord avec le prix «17000» puis avec le prix «19000».

Exemple 05: les valeurs de tri pandas nan au début

Nous importerons le Numpy en NP dans ce cas. Le Numpy est utilisé pour les calculs numériques des données. «Nan» signifie «pas un nombre». Ainsi, lorsqu'il n'y a pas de numéro attribué dans les données, il apparaît comme «nan». Nous ferons l'exemple pour que les valeurs «nan» apparaissent d'abord dans le dataframe. La fonction de tri Pandas est utilisée avec le «Na_Position» = 'First' », cela signifie que la position est définie comme la première des valeurs non disponibles ou nuls dans le« DF ». Nous avons choisi la colonne «année» pour avoir ses valeurs «nan» en haut de la dataframe.

La sortie montre la valeur nan d'abord dans la colonne de l'année.

Conclusion

La valeur de tri des pandas est une méthode efficace et très bénéfique. Nous avons couvert toutes les méthodes possibles pour trier les valeurs en pandas dans cet article: l'ordre ascendant et décroissant de la colonne sélectionnée DataFrame. Nous avons fait le tri à colonne multiples, que nous avons fait de deux manières: la manière normale et la situation d'apparence de l'année similaire. Enfin, nous avons d'abord réalisé les valeurs «nan» dans le dataframe. Chaque méthode de la valeur de tri des pandas est digne d'elle-même, car travailler sur une grande échelle de tri de données est difficile et presque impossible, cette fonction de Pandas a connu un énorme succès pour le tri des données de toutes les manières selon le besoin.