Tout en travaillant avec un grand nombre d'ensembles de données, les utilisateurs rencontrent souvent plusieurs valeurs nulles ou nan. Les valeurs nulles représentent les valeurs nulles dans un ensemble de données. Dans Python, les développeurs rencontrent également des valeurs NAN lorsqu'ils travaillent avec Pandas à Python. Pour filtrer ces valeurs nulles, Python comprend différentes fonctions.
Les résultats de ce blog sont:
Qu'est-ce que les «pandas» dans Python?
Dans Python, "pandas"Est la bibliothèque la plus utilisée pour travailler avec le flotteur, latime, la chaîne, etc., Types d'ensembles de données. Il a plusieurs fonctions pour explorer, analyser, nettoyer et manipuler les données souhaitées. En d'autres termes, permet aux utilisateurs de filtrer les lignes ayant les valeurs NAN en utilisant le «trame de données«Fonctions, comme«trame de données.dropna ()", et "trame de données.notnull ()" les fonctions.
Quelles sont les valeurs NAN?
Presque tous les ensembles de données ont des valeurs nuls, le NULL est une valeur particulière à virgule flottante qui représente «Pas un nombre". Les données sont disponibles en plusieurs formes et formulaires, y compris des valeurs vides / manquantes qui sont représentées comme un NAN. Comme d'autres langages de développement, Python a également plusieurs façons de représenter les valeurs manquantes dans les ensembles de données.
Comment filtrer des lignes de données particulières à partir de l'ensemble de données qui contient une valeur NAN en utilisant le Pandas DataFrame en Python?
Pour filtrer les lignes spécifiques de l'ensemble de données qui contient des valeurs NAN, nous allons d'abord créer un ensemble de données contenant des valeurs NAN. Pour ce faire, importez le «nombant", et "pandas»Modules de bibliothèque et créez un nouvel ensemble de données. Ensuite, vérifiez l'ensemble de données nouvellement créé:
Importer des pandas en tant que PD
Importer Numpy comme NP
dataframe = pd.DataFrame ('auteurs': ['Maria', 'Henry', 'Marier', NP.Nan, 'Alex'],
«Nom d'utilisateur»: [«FMN018», np.Nan, «FM012», «Mg002», «MA025»],
«Expérience»: [«1 an», «2 ans», NP.Nan, «6 mois», «9 mois»]
)
trame de données
Comme vous pouvez le voir, l'ensemble de données créé comprend plusieurs valeurs NAN:
Maintenant, utilisez le «notnull ()”Fonction pour filtrer la ligne spécifique à partir de la colonne particulière qui contient des valeurs NAN:
dataFrame [dataFrame ['Experience'].notnull ()]
Sortir
Comment filtrer plusieurs lignes de données à partir de l'ensemble de données qui contient une valeur NAN en utilisant des données de données Pandas dans Python?
Parfois, les utilisateurs doivent filtrer les multiples lignes à partir de l'ensemble de données fourni à partir de plusieurs colonnes. Pour ce faire, spécifiez les noms de colonne souhaités, puis utilisez le «utilisez«tous()”Fonction avec le«notnull ()" fonction:
colonnes = [«Experience», «nom d'utilisateur»]
dataFrame [dataFrame [colonnes].notnull ().tout (1)]
On peut observer que plusieurs lignes sont filtrées à partir de l'ensemble de données qui contient des valeurs NAN à partir des colonnes spécifiées:
Comment filtrer toutes les lignes de l'ensemble de données qui contient une valeur NAN à l'aide de Pandas DataFrame dans Python?
Si les utilisateurs souhaitent filtrer toutes les lignes à partir de l'ensemble de données qui contiennent des valeurs NAN à l'aide du Pandas DataFrame dans Python, le «dropna ()»La fonction peut être utilisée:
trame de données.dropna ()
Sortir
Nous avons compilé les moyens les plus simples de filtrer les valeurs NAN à Python.
Conclusion
Pour filtrer les lignes ayant les valeurs NAN en Python, le «trame de données«Fonctions, comme«trame de données.notnull ()", et "trame de données.dropna ()»Les fonctions sont utilisées. Ce blog a fourni les différentes façons de filtrer les valeurs NAN en Python.