Pandas tri par colonne

Pandas tri par colonne
Un python est un excellent outil pour le traitement des données, grâce à une communauté florissante d'outils Python centrés sur les données. Pandas est également l'un de ces programmes, et cela simplifie considérablement l'importation et l'analyse des données. Le tri des données dans Python peut être effectué de différentes manières. Lorsqu'un utilisateur souhaite trier un ensemble de données particulier en fonction d'une colonne spécifique, la question se pose. Selon la colonne fournie, la méthode sort_values ​​() dans Pandas organise un ensemble de données dans la direction ascendante ou descendante. Il diffère de la méthode Python triée en ce qu'il ne peut pas trier un ensemble de données et ne peut pas choisir une colonne spécifique. Par conséquent, nous avons décidé d'écrire cet article pour simplifier le tri avec la fonction sort_values ​​(). Commençons.

Exemple 01:

Commençons par notre premier exemple de l'article d'aujourd'hui sur le tri des cadres de données des pandas via les colonnes. Pour cela, vous devez ajouter la prise en charge du panda dans le code avec son objet «PD» et importer les pandas. Après cela, nous avons commencé le code avec l'initialisation d'un dictionnaire DIC1 avec des types mixtes de paires clés. La plupart d'entre eux sont des chaînes, mais la dernière clé contient la liste des types entiers comme valeur. Maintenant, ce dictionnaire DIC1 a été converti en Pandas DataFrame pour l'afficher dans la forme tabulaire de données à l'aide de la fonction DataFrame (). La trame de données résultante sera enregistrée dans la variable «D». La fonction d'impression est là pour afficher la trame de données d'origine sur la console Spyder 3 en utilisant la variable «D» dedans. Maintenant, nous utilisons la fonction sort_values ​​() via le cadre de données «D» pour le trier en fonction de l'ordre croissant de la colonne «C3» de la trame de données et l'enregistrez dans la variable D1. Ce cadre de données trié D1 sera imprimé dans la console Spyder 3 à l'aide du bouton d'exécution.

Importer des pandas en tant que PD
dic1 = 'c1': ['John', 'William', 'Laila'], 'C2': ['Jack', 'Worth', 'Sky'], 'C3': [36, 50, 25]
D = PD.DataFrame (DIC1)
print ("\ n original dataframe: \ n", d)
d1 = D.sort_values ​​('c3')
print ("\ n trié par la colonne 3: \ n", d1)

Après avoir exécuté ce code, nous avons la trame de données d'origine puis la trame de données triée en fonction de l'ordre ascendant de la colonne C3.

Disons que vous souhaitez commander ou trier la trame de données dans l'ordre descendant; vous pouvez le faire avec la fonction sort_values ​​(). Il vous suffit d'ajouter le ascendante = false dans ses paramètres. Donc, nous avons essayé le même code avec cette nouvelle mise à jour. De plus, cette fois, nous avons trié la trame de données en fonction de l'ordre descendant de la colonne C2 et l'a affiché sur la console.

Importer des pandas en tant que PD
dic1 = 'c1': ['John', 'William', 'Laila'], 'C2': ['Jack', 'Worth', 'Sky'], 'C3': [36, 50, 25]
D = PD.DataFrame (DIC1)
print ("\ n original dataframe: \ n", d)
d1 = D.sort_values ​​('c1', ascendant = false)
print ("\ n trié dans l'ordre descendant de la colonne 1: \ n", d1)

Après avoir exécuté le code mis à jour, nous avons affiché le cadre d'origine sur la console. Après cela, le cadre de données trié selon l'ordre descendant de la colonne C3 a été affiché.

Exemple 02:

Commençons par un autre exemple pour voir le fonctionnement de la fonction sort_values ​​() de Pandas. Mais, cet exemple sera un peu différent de l'exemple ci-dessus. Nous allons trier la trame de données en fonction des deux colonnes. Alors, commençons ce code avec la bibliothèque du Panda comme une importation «PD» à la première ligne. Le dictionnaire de type entier DIC1 a été défini et a des touches de type de chaîne. Le dictionnaire a de nouveau été converti en un cadre de données à l'aide de la fonction Pandas Everlasting DataFrame () et enregistré dans la variable «D». La méthode d'impression affichera le cadre de données «D» sur la console Spyder 3. Maintenant, la trame de données sera triée à l'aide de la fonction «sort_values ​​()», prenant deux noms de colonnes, C1 et C2, I.e. clés. L'ordre de tri a été décidé comme ascendant = vrai. La déclaration d'impression affichera le cadre de données mis à jour et trié «D» sur l'écran de l'outil Python.

Importer des pandas en tant que PD
dic1 = 'c1': [3, 5, 7, 9], 'C2': [1, 3, 6, 8], 'C3': [23, 18, 14, 9]
D = PD.DataFrame (DIC1)
print ("\ n original dataframe: \ n", d)
d1 = D.sort_values ​​(par = ['c1', 'c2'], ascendant = true)
print ("\ n tri par ordre décroissant de la colonne 1 & 2: \ n", d1)

Une fois ce code terminé, nous l'avons exécuté dans Spyder 3 et obtenu le résultat ci-dessous trié en fonction de l'ordre croissant des colonnes C1 et C2.

Exemple 03:

Jetons un coup d'œil au dernier exemple de l'utilisation de la fonction sort_values ​​(). Cette fois, nous avons initialisé un dictionnaire de deux listes de types différents, i.e. cordes et nombres. Le dictionnaire a été converti en un ensemble de cadres de données à l'aide de la fonction Pandas «DataFrame ()». Le cadre de données «D» a été imprimé tel qu'il est. Nous avons utilisé deux fois la fonction «Sort_values ​​()» pour trier la trame de données selon la colonne «Age» et la colonne «Nom» séparément sur deux lignes différentes. Les deux cadres de données triés ont été imprimés avec la méthode d'impression.

Importer des pandas en tant que PD
dic1 = 'name': ['John', 'William', 'Laila', 'Bryan', 'Jees'], 'Age': [15, 10, 34, 19, 37]
D = PD.DataFrame (DIC1)
print ("\ n original dataframe: \ n", d)
d1 = D.sort_values ​​(par = 'age', na_position = 'premier')
Print ("\ n trié dans l'ordre croissant de la colonne 'Age': \ n", d1)
d1 = D.sort_values ​​(par = 'name', na_position = 'premier')
print ("\ n tri par ordre croissant de la colonne 'nom': \ n", d1)

Après avoir exécuté ce code, nous avons d'abord affiché la trame de données d'origine. Après cela, le cadre de données trié selon la colonne «Age» a été affiché. Enfin, le cadre de données a été trié selon la colonne «nom» et affiché ci-dessous.

Conclusion:

Cet article a magnifiquement expliqué le fonctionnement de la fonction «Sort_values ​​()» de Panda pour trier n'importe quel cadre de données en fonction de ses différentes colonnes. Nous avons vu comment trier avec une seule colonne pour plus d'une colonne dans Python. Tous les exemples peuvent être implémentés sur n'importe quel outil Python.