Pandas tombe une ligne

Pandas tombe une ligne
Lorsque vous traitez avec des ensembles de données Python, les ingénieurs nettoient les données selon les besoins pour la tâche. La fonction de dépôt est fréquemment utilisée pour éliminer les colonnes et les lignes qui pourraient ne pas être pertinentes pour la tâche.

Fonction Drop Pandas:

La méthode «Drop ()» dans le Pandas DataFrame supprime les étiquettes fournies des colonnes et des lignes. La fonction Drop () élimine les lignes et les colonnes soit en spécifiant les noms d'étiquette ainsi que les axes correspondants ou en donnant explicitement aux indices ou aux noms de colonne.

Lorsque nous utilisons le multi-index, nous éliminons les étiquettes à différents niveaux en indiquant le niveau. Il est utilisé pour supprimer le cadre de données, que nous n'avons pas besoin d'inclure dans notre analyse.

La syntaxe de cette fonction est la suivante:


La fonction «drop ()» contient sept paramètres au total, dont certains sont facultatifs. Discutons brièvement de tous les paramètres.

Le premier paramètre "Étiquettes" est soit l'index, soit plutôt le nom de colonne qui doit être éliminé. Il est généralement spécifié pour être une seule étiquette ou une liste. Le "axe" A deux valeurs possibles: 0 et 1. Lorsque nous devons passer de l'index / ligne, nous écrivons 0 dans le paramètre, et si nous devons supprimer des colonnes, nous mettons 1. Il est défini sur 0 par défaut. "indice" peut être utilisé au lieu de spécifier l'axe (étiquettes, axe = 0 est égal à index = étiquettes).

Le paramètre suivant est "Colonnes". Il est utilisé pour spécifier des colonnes. Les index et les colonnes sont équivalents à l'axe qui ne peut pas être utilisé en conjonction. "les niveaux" est un argument facultatif pour l'utilisation du multiindex, et il spécifie le niveau à partir duquel les étiquettes seraient abandonnées. "en place" est un argument booléen qui, si vrai, remplit la fonction en place et ne renvoie aucune. Son paramètre par défaut est faux. Le dernier paramètre est "les erreurs". Lorsqu'il est configuré pour «ignorer», seules les étiquettes préexistantes sont supprimées et l'erreur est ignorée. Il a deux valeurs possibles. Le premier est «ignorer», tandis que la seconde est «augmenter». Par défaut, il est défini sur «surélevé».

Dans cet article, nous vous démontrerons sa mise en œuvre pratique avec des exemples de codes. Regardons comment nous pouvons le faire dans Python.

Exemple # 1: Utilisation de la méthode Pandas Drop () pour supprimer une seule ligne par index

Nous apprendrons dans cette illustration pour supprimer une seule ligne par l'index du dataframe fourni à l'aide du Pandas «DataFrame.Méthode drop () ”.

Pour commencer la mise en œuvre pratique du code Python pour implémenter le «DataFrame.Drop () ”Fonction sur les cadres de données Pandas, nous devons d'abord choisir un bon outil ou un bon logiciel qui peut exécuter nos programmes Python. Ici, nous avons sélectionné et téléchargé l'outil «Spyder». Nous avons installé la configuration de l'outil «Spyder», puis lancé l'outil. Une fois que vous voyez l'interface de l'outil "Spyder", ouvrez un nouveau fichier en cliquant sur l'option "Nouveau fichier" ou en appuyant sur les touches "Ctrl + N". Il lancera un nouveau fichier Python avec l'extension ".py "qui fait référence à" Python ". Nous avons maintenant tout ce que vous travaillez avec.

Le code principal commence par le chargement des bibliothèques nécessaires dans le programme Python. Comme le décrit le titre de notre article, nous allons travailler sur certains modules sur «Pandas». Donc, à partir de cela, nous comprenons que notre pré-requis à l'implémentation de ce code est d'importer la bibliothèque «pandas» dans le fichier Python. Pour l'obtenir, nous devons écrire un script Python «Importer des pandas en tant que PD». Cela nous permettra d'utiliser les fonctionnalités de Pandas dans notre programme, et cela nous permet d'y accéder en utilisant «PD» au lieu de «pandas» à chaque fois. Maintenant, nous devons créer un cadre de données Pandas. Pandas Us avec une méthode très simple pour créer un cadre de données, qui est «PD.Trame de données()".

Ici, «PD» est Pandas et «DataFrame» est le mot clé pour créer un cadre de données. Nous avons construit un cadre de données qui contient trois colonnes: «produit», «coût» et «quantité». Toutes ces colonnes ont reçu certaines valeurs. La colonne «Produit» a des valeurs de chaîne qui sont «téléphone», «ordinateur portable», «CPU», «imprimante», «souris», «clavier» et «haut-parleur». Les colonnes «Cost» stockent les valeurs entières «5000», «7000», «4300», «8150», «1050», «2150» et «1500». La dernière colonne, «Quantité», détient les valeurs «3», «2», «1», «5», «1», «2» et «4». Gardez à l'esprit lors de la création de Dataframe que toutes les colonnes d'une dataframe doivent avoir la même taille ou la même durée des valeurs.

Donc, nous avons toutes les colonnes de longueur sept. Pour stocker ce cadre de données, nous avons créé un «électronique» d'objet de trame de données et lui avons attribué la sortie générée en invoquant le «PD.Fonction DataFrame () ”. Enfin, pour afficher cette trame de données, nous avons utilisé la méthode «print ()» en donnant l'objet «électronique» comme paramètre, de sorte qu'il imprimera maintenant le contenu stocké dans cet objet de trame de données.


Pour l'exécution du programme Python ci-dessus, nous devons appuyer sur le bouton "Exécuter le fichier" de l'outil "Spyder", ou vous pouvez également appuyer sur les touches "Shift + Enter" pour exécuter le script. Nous avons un cadre de données avec trois colonnes et sept valeurs affichées chacune sur le terminal.


De là, notre tâche principale commence. Nous devons maintenant apprendre comment supprimer une seule ligne par index en utilisant le Pandas «DataFrame.Méthode drop () ”. Nous devons simplement fournir le nom du cadre de données que nous avons créé ci-dessus avec le «.Drop () ”Fonction, et comme nous devons laisser tomber une ligne, par conséquent, le paramètre que nous avons utilisé ici est« Index ». Nous avons fourni le numéro d'index «3», que nous voulions éliminer du cadre de données. Cela supprimera la ligne entière avec «index = 3».

Pour stocker la sortie de cette fonction, nous avons créé une variable «New_electronics». Nous avons appelé la méthode «print ()» pour afficher un texte spécifié entre ses parenthèses, puis affiché la variable de données de données mise à jour dans la variable «new_electronics» en invoquant la méthode «print ()».


L'exécution de l'extrait de code susmentionné nous procurera une trame de données mise à jour après avoir supprimé la 3ème ligne de la trame de données générée précédemment.


Dans cette image de sortie, vous pouvez voir que la 3ème ligne est éliminée du cadre de données.

Exemple # 2: Utilisation de la méthode Pandas Drop () pour supprimer plusieurs lignes par index

Nous avons déjà appris à éliminer une seule ligne du cadre de données à l'aide du Pandas «DataFrame.Méthode drop () ”. Maintenant, nous verrons ce que nous pouvons faire si nous devons jeter plus d'une ligne dans le cadre de données. Pour cette illustration, nous avons utilisé le cadre de données créé dans l'exemple ci-dessus. Nous travaillerons directement sur la tâche principale, car toutes les autres choses ont été expliquées dans le cas ci-dessus. Pour laisser tomber plusieurs lignes, nous avons utilisé le «DataFrame.Drop () ”fonctionne comme« électronique.drop () ”, qui est le nom de notre trame de données précédemment créée.

Nous avons utilisé le paramètre «Index» et lui avons attribué les nombres d'index que nous voulons passer de la trame de données comme «index = [1, 3, 5]», ce qui signifie que nous devions rejeter les lignes «1», «3» et «5» du cadre de données. Nous appelons ensuite simplement la méthode «print ()» pour afficher la trame de données mise à jour.


Cela nous donne la sortie suivante, où les lignes 1, 3 et 5 sont éliminées du cadre de données.

Conclusion:

Ce guide décrit et élabore sur le module Pandas «DataFrame.drop () ”pour déposer les lignes de la trame de données. Nous avons défini et expliqué brièvement les différents paramètres de cette fonction. Nous vous avons présenté le concept de supprimer une seule ligne par index dans le cadre de données ainsi que la suppression de plusieurs lignes par index. Nous avons mis en œuvre les deux concepts pratiquement avec des codes Python sur l'outil «Spyder» et affiché les cadres de données résultants générés à partir des programmes. Ce morceau d'écriture est juste un guide, mais votre pratique avec des codes pratiques en fera votre compétence.