Exemple de dataframe
Dans ce tutoriel, nous utiliserons un exemple de données de données avec les données ci-dessous stockées dans les films.Fichier CSV:
,Titre, release_year, imdb_ratingSupprimer les lignes en fonction de l'état de la colonne
Pour supprimer les lignes en fonction d'une seule condition dans une colonne spécifiée, nous pouvons utiliser la fonction Drop (). Par exemple, si nous voulons supprimer les lignes où la version_year est en dessous de 2012, nous pouvons faire:
df = df.drop (df [df ['release_year'] < 2012].index, inplace=False)Dans cet exemple, nous commandons la fonction DROP pour supprimer toutes les lignes où la valeur de la colonne 'release_year' est inférieure à 2012. Le paramètre «InPlace» empêche la fonction de modifier le dataframe d'origine. Cela devrait revenir:
Si vous l'avez remarqué, les lignes dans la sortie ci-dessus ont une valeur de version_year de 2012 et supérieure.
Supprimer les lignes basées sur plusieurs conditions.
Nous pouvons également associer plus d'une condition lors de la suppression des lignes. Par exemple, pour supprimer les lignes où la notation est supérieure à 7.3 Et l'année de sortie est supérieure à 2018, nous pouvons faire:
df.drop (df [(df ['release_year']> 2018) & (df ['imdb_rating']> = 7.3)].index, inplace = false)Le code ci-dessus nous permet d'utiliser l'opérateur AmperSand pour combiner plusieurs conditions.
Fermeture
L'article montre comment utiliser la fonction Pandas Drop () pour supprimer les lignes qui correspondent aux conditions uniques ou multiples dans un Pandas DataFrame.