Query Pandas Dataframe

Lena Dupuy

Le package Python en fait une excellente langue pour effectuer une analyse des données. Les programmes qui permettent à l'acquisition et à l'analyse des données considérablement plus simples est Pandas. Nous avons un dataframe et nous filtrons les données en fonction de nos besoins de cette dataframe dans pandas. L'analyse des données prévoit de nombreuses techniques de filtrage. Il existe de nombreuses façons de filtrer les données à partir de la dataframe spécifiée à l'aide des méthodes Pandas. L'un d'eux est la méthode «Query ()» qui nous aide à filtrer certaines données à partir du dataframe. Nous pouvons interroger le DataFrame en utilisant la fonction «Query ()» dans Pandas. Une expression de requête est transmise à la fonction «Query ()» et il renvoie le résultat par l'instruction de requête retournée. Nous utiliserons la méthode «Query ()» dans ce guide et nous expliquerons comment il aide à Pandas à filtrer les données souhaitées à partir du DataFrame.

Syntaxe:

Trame de données.Query (expr, inplace = false, ** kwargs)

Ici, nous avons mis la condition comme le premier paramètre de la méthode «Query ()». L'installation est facultative. Si nous n'ajoutez pas cela, sa valeur par défaut est «fausse» qui est ajustée automatiquement. Nous pouvons également le définir sur «True» qui met à jour le DataFrame.

Maintenant, nous allons utiliser la méthode «query ()» dans Pandas dans ce guide et nous l'expliquerons ici.

Exemple 1:

Nous démonstarte la méthode «query ()» dans les pandas dans ce guide. Nous utilisons l'application «Spyder» pour écrire le code Pandas. Nous sommes conscients que nous devons importer certaines méthodes de pandas comme «PD». Nous développons le «list_data» et nous plaçons le «p_name» et «p_age» dans le «list_data». Le «p_name» contient «Smith, Oscar, Mary, Theo, Teddy et John». Le «P_age» contient «50, 33, 56, 29, 45 et 30». Nous modifions la liste de création «list_data» dans la dataframe «my_df». Nous les modifions dans le dataframe car nous devons appliquer la méthode «query ()» à la dataframe. Ainsi, ce «my_df» est créé ici qui est également affiché puisque nous l'insérons dans la fonction «print ()» suivante.

Maintenant, nous utilisons la méthode «Query ()» pour extraire certaines données. Nous obtenons les données dont l'âge est supérieur à 30. Pour cela, nous ajoutons la condition dans la méthode «Query ()» et utilisons cette méthode à l'intérieur de l'impression. Le résultat nous rend également. Maintenant, il filtre les données dont l'âge est supérieur à 30 ans et les affiche sur la sortie.

Il existe deux méthodes pour exécuter le code souhaité lorsque nous le compilons et l'exécutons dans "Spyder". L'un d'entre eux est d'appuyer sur le «Shift + Entrée». L'autre méthode consiste à utiliser l'icône «Run» de l'application «Spyder» pour effectuer le code. Nous obtenons la sortie spécifiée lors de l'exécution. Premièrement, le Frame complet est rendu. Ensuite, nous filtrons les données de cette dataframe dont l'âge est supérieur à 30. Les données filtrées sont également présentées dans les éléments suivants. Nous filtrons ces données simplement en utilisant la méthode «Query ()» dans Pandas.

Exemple 2:

Nous créons une liste imbriquée «Player_data» et ajoutons une colonne «Player_name» où nous avons «Emma, Samuel, Robert, Smith, Noah, Jessica et Harper». Ensuite, nous ajoutons la colonne «Player_age» qui contient «22, 26, 21, 25, 29, 24 et 28». Ensuite, vient la colonne «Score_1» qui contient «29, 28, 16, 17, 35, 20 et 15». La colonne «Score_2» contient «28, 45, 49, 62, 70, 55 et 40». Le «score_3» contient «24, 13, 59, 62, 72, 64 et 66». Et le dernier que nous avons, c'est la colonne «Score_4» qui a «38, 44, 69, 72, 81, 71 et 79». Cette liste «Player_data» est transformée en DataFrame à l'aide de la méthode Pandas. Nous nommons cette données de données comme "Player_DF".

Comme nous ajoutons la "Player_DF" à la fonction "print ()" suivante et l'affichage. Maintenant, nous incluons la condition dans la fonction "Query ()" et utilisons cette méthode à l'intérieur de la méthode print () pour acquérir les données dont "Score_1" est supérieur à 20. Nous le mettons dans «Print» qui rend également le résultat pour nous. Les données dont le «score_1» est plus de 20 est désormais filtré et affiché sur la console.

Comme vous pouvez le voir, il n'y a que trois lignes dans lesquelles le «score_1» est supérieur à 20. Ainsi, cette méthode «Query ()» rend ces données à l'écran après avoir affiché le DataFrame complet.

Exemple 3:

Le «fruit_data» est créé. Les «fruit_name» et «fruit_quantity» sont ajoutés. La «pomme, orange, mangue, pomme, banane, pomme, litchi et pomme» sont répertoriées sous «fruits_name». Leurs quantités qui sont «5 kg, 7 kg, 2 kg, 4 kg, 5 kg, 7 kg, 2 kg et 4 kg» sont répertoriées sous «Fruits_quantity». Nous transformons la liste imbriquée «Fruits_data» en DataFrame «Fruits_df."Ce" fruits_df "est formé ici et est également affiché car nous l'entrée dans la fonction" print () "suivante. Maintenant, nous filtrons certaines données à l'aide de la technique «Query ()». Nous voulons filtrer «Apple» à partir de cette dataframe, nous avons donc mis la condition où le «fruits_name» est égal à «Apple». Nous affichons également les «pommes» sur le terminal.

Dans ce résultat, après avoir rendu l'intégralité de DataFrame, les lignes qui contiennent «Apple» sont filtrées. Les données filtrées sont également affichées dans l'illustration suivante. Nous utilisons la méthode Pandas Query () pour filtrer ces données.

Exemple 4:

Nous développons la liste des imbriquées «result_9th» après l'importation de la méthode Pandas. Nous ajoutons une chronique «Nom» à notre liste de création «Result_9th» et la remplit de «Samuel, George, James, Melissa, William, Farnham et Smith». La colonne «Subj1» contient les valeurs «47, 30, 54, 71, 68, 16 et AB». Le «subj2» est ensuite ajouté avec les valeurs suivantes: «81, 23, 48, 34, 21, 15 et AB». La colonne «Subj3» conatines les valeurs suivantes: «29, 14, 28, 55, 29, 27 et AB». La colonne "Subj4" contient les valeurs suivantes: «59, 27, 58, 75, 59, 17 et AB». Le «subj5» contient les valeurs suivantes: «90, 4, 82, 85, 95, 22 et ab». Ensuite, nous ajoutons également la colonne «Pass / Fail» qui contient le statut «Pass» et «Fail» des étudiants.

Nous utilisons ici la technique des pandas pour convertir cette liste «result_9th» en un dataframe que nous avons appelé «result_9^e_df ". Le «résultat_9^e_df »est rendu à la suite de notre ajout à la méthode suivante« print () ». Maintenant, nous filtrons les données de l'étudiant dont le nom est «James». Nous mettons ce nom comme condition de la méthode «Query ()». Nous plaçons le nom de la colonne «Nom» et l'égalons à «James». Ensuite, nous stockons les données de l'étudiant «James» dans le «DF2». Ensuite, nous plaçons ce «DF2» dans «Print» pour afficher les données de «James».

Le premier DataFrame contient le résultat de 7 étudiants que nous ajoutons au DataFrame. Nous extraissons les données «James» de ce DataFrame. De cette façon, nous pouvons facilement extraire ou filtrer les données que nous voulons obtenir de la dataframe en pandas.

Conclusion

Ce guide est là pour explorer la méthode «Query ()» dans Pandas. Nous avons démontré différents exemples dans ce guide et expliqué chacun d'eux en détail pour vous fournir une bonne compréhension de la méthode «Query ()». Nous avons discuté de l'utilisation de la méthode «Query ()» pour filtrer les données spécifiques de DataFrame. Pour votre avantage, chaque exemple de ce guide et la syntaxe de cette méthode «Query ()» sont soigneusement présentés ici. Vous devriez être en mesure d'apprendre ce concept «Query ()» dans Pandas à l'aide de ce guide.

Python

Python os mkdir

Le «OS.La méthode mkdir () »du module« OS »est utilisée pour créer un répertoire unique, plusieurs r...

Nathan Blanc

Python

Pandas read_csv multiprocessement

Pour améliorer la vitesse de chargement des données, y compris ses avantages et ses limites le «PD.L...

Nathan Blanc

Python

TSPLOT DE SEA

À Python, le «Seaborn.La méthode lineplot () »est utilisée pour tracer plusieurs lignes dans un seul...

Zoe Martinez