Pandas dépose toutes les colonnes sauf

Pandas dépose toutes les colonnes sauf
Les données doivent être nettoyées, structurées et rangé avant de commencer toute analyse. Pour obtenir la sélection optimale des données pour une évaluation ou une présentation particulière, il est parfois nécessaire de modifier un Pandas DataFrame pour éliminer les colonnes inutiles ou pour optimiser l'ensemble de données pour la création de modèle. Dans les pandas, la modification des colonnes peut se produire dans une variété de techniques. Il est parfois difficile de comprendre comment supprimer les colonnes d'un dataframe. La commande «DataFrame Drop» est la clé. En utilisant le «DF.Fonction Drop () ”, les colonnes spécifiées peuvent être jetées. Dans ce guide, nous comprendrons comment exclure les colonnes dans un pandas dataframe à l'exception de ceux spécifiés.

Méthode Pandas Drop ()

La méthode pandas «drop ()» nous aide à rejeter les colonnes spécifiées à partir du dataframe fourni tout en gardant les sélectionnés dans le cadre de données résultant. Cela peut être fait en utilisant la syntaxe suivante:

Nous verrons sa démonstration pratique avec les programmes Python dans cet article.

Exemple 1: Utilisation de la fonction Pandas Drop () pour supprimer toutes les colonnes, sauf une seule colonne spécifiée, dans le DataFrame réel

Cet exemple vous fera comprendre l'exécution pratique de la méthode Pandas «Drop ()» pour éliminer toutes les colonnes dans un dataframe sauf les certains que nous choisirons à afficher.

Nous aurions besoin de logiciels ou d'un outil pour compiler le programme que nous générerons pour l'exemple. Des choix, celui que nous avons trouvé être l'outil le plus approprié pour nos démonstrations est l'outil «Spyder». Un nouveau fichier de projet est ouvert dans l'outil, puis nous commençons le script. Nous avons chargé le module nécessaire qui est des pandas ici. La bibliothèque Pandas a été importée dans le fichier Python et est aliasée comme «PD».

Nous devons ensuite créer un dataframe à l'aide de la méthode de la boîte à outils Pandas. Pandas a une méthode très simple «PD.DataFrame () ”pour construire un dataframe. Ici, «PD» est l'alias des pandas tandis que le «DataFrame», comme le nom le représente, est le mot-clé qui invoque le processus de création de DataFrame. Nous avons appelé cette méthode et l'avons demandé de créer un dataframe avec 5 colonnes. Nous avons spécifié les étiquettes pour les colonnes et avons fourni la même longueur de valeurs pour chaque colonne.

Les étiquettes que nous avons définies pour les colonnes sont «janvier», «février», «mars», «avril» et «mai». Les valeurs que nous avons stockées dans la colonne «janvier» sont «1», «2», «3», «4», «3» et «5». La colonne «Février» a des valeurs «7», «8», «9», «10», «11» et «12». La «Marche» tient des entrées comme «13», «14», «15», «16», «17» et '18 ». Nous avons fourni des valeurs à la colonne «Avril» en tant que «19», «20», «21», «22», «23» et «24». La dernière colonne de DataFrame «May» porte ces valeurs «25», «26», «27», «28», «29» et «30». Nous avons fourni la même taille de colonne pour chaque colonne de DataFrame.

Comme vous pouvez l'observer, chaque colonne contient 6 valeurs. Si vous modifiez la longueur d'une colonne dans une dataframe particulière, cela vous donnera une erreur de longueur de colonne inégale. Quand le «PD.La fonction DataFrame () ”est invoquée avec les colonnes fournies, elle générera un DataFrame. Il nécessite désormais un objet ou une variable dans laquelle il peut placer ce dataframe, donc ne sera pas perdu ce dataframe. De plus, chaque fois que nous avons besoin de travailler avec cette dataframe particulière, nous pouvons y accéder via l'objet que nous avons fourni pour stocker le dataframe. L'objet DataFrame que nous avons créé ici est nommé «mois». Nous l'avons attribué le résultat du «PD.Méthode DataFrame () ».

La fonction «print ()» imprime tout ce que vous y transmenez. Nous lui avons fourni nos «mois» d'objet DataFrame pour afficher le contenu qu'il a préservé.

L'exécution du script Python élaboré ci-dessus simplement en frappant la touche "Exécuter le fichier" met un dataframe ayant 5 colonnes spécifiées sur la console Python pour afficher.

Maintenant, nous verrons comment utiliser la méthode «drop ()» pour éliminer toutes les colonnes du dataframe sauf une certaine colonne que nous garderons dans le dataframe.

Nous avons invoqué le «DF.Drop () "Méthode en fournissant le" DF.Colonnes.Méthode différence () »ainsi que deux autres paramètres« Axe »et« Inplace ». Le ".La méthode difFrence () »nous fournit le complément des données que nous allons entrer en tant que paramètre. Dans ce cas, nous avons fourni la colonne «March». Lorsque la méthode «Drop ()» est invoquée pour rejeter les colonnes dans le dataframe «mois», il conservera les valeurs de la colonne «mars».

Le paramètre «axe» est défini sur «1» qui fait référence aux colonnes. Et le «sur place» est apprécié comme «vrai» qui effectuera toutes les modifications de la dataframe originale sans en faire aucune copie. Après avoir appelé cette fonction, nous devons afficher le dataframe mis à jour. Nous avons utilisé la méthode «print ()» pour afficher le dataframe réel avec du contenu modifié à l'écran.

C'est à quoi ressemble notre réelle Dataframe. Nous avons abandonné toutes les colonnes mais avons conservé la colonne «March» dans le DataFrame mis à jour.

Exemple 2: Utilisation de la fonction Pandas Drop () pour supprimer toutes les colonnes, sauf plusieurs colonnes spécifiées dans la copie de DataFrame

Pour cette démonstration, nous verrons comment supprimer toutes les colonnes à l'exception des multiples colonnes sélectionnées et apporter les modifications à la copie du DataFrame au lieu du DataFrame réel.

Dans cet exemple, nous utiliserons le dataframe que nous avons construit dans l'instance ci-dessus. Après avoir affiché le dataframe, nous avons invoqué la méthode «drop ()». Entre les parenthèses du «DF.Fonction Drop () ”, nous avons appelé le« DF.Différence () ”Fonction et nous avons fourni deux colonnes« janvier »et« mars ». Ainsi, ces deux colonnes seront conservées dans le DataFrame et toutes les colonnes restantes seront supprimées dans le Frame de données «mois». Le paramètre «axe» est évalué à «1». Cela dira à Python d'appliquer la fonction en termes de ligne.

Ici, le troisième paramètre «InPlace» est défini sur «False». Garder ce «faux» signifie que la fonction apportera les modifications à la copie du dataframe au lieu de la dataframe réelle. Pour stocker cette copie modifiée du «mois» de dataframe, nous avons créé une «copie» variable. Cette variable conservera le dataframe mis à jour après avoir supprimé toutes les colonnes sauf les deux que nous avons spécifiées qui sont «janvier» et «mars». Enfin, nous avons utilisé la méthode «print ()» pour montrer l'issue du «DF.Drop () ”Méthode sur le terminal en le faisant passer la variable« Copie ».

La méthode «print ()» nous présente deux données de données lorsque nous exécutons le script Python ci-dessus. Ici, la première dataframe affichée est le Frame de données réel sans aucune modification tandis que le deuxième DataFrame est la copie du DataFrame réel après avoir supprimé toutes les colonnes sauf que les deux spécifiés sont affichés.

Conclusion

Décider quelles données conserver et lesquelles omettre lors de l'analyse des ensembles de données est un concept très essentiel pour apprendre. Dans cet article, nous avons développé le «DF.Fonction Drop () ”avec sa syntaxe. Nous avons implémenté cette méthode sur l'outil Spyder. Le premier exemple vous apprend à modifier le DataFrame réel tandis que le deuxième DataFrame explique comment faire une copie du DataFrame pour garder les modifications.