Pandas isna

Nathan Blanc

«Pandas est l'un des packages du langage Python qui rend l'analyse des données beaucoup mieux et plus facile à poursuivre. Dans le domaine de l'informatique, l'analyse des données et le prétraitement est presque à chaque étape, et dans laquelle les données manquantes. Ainsi, voici le «Pandas Isna», qui est une fonction qui est utilisée pour détecter les valeurs manquantes des données. Il fonctionne d'une manière qui renvoie un objet booléen de taille similaire, qui indique que les valeurs dans les données données sont «NA», ce qui signifie aucun, et les caractères tels que les chaînes qui sont déclarées vides.

Les valeurs manquantes montrent le «nan» ou «aucun», comme expliqué. La méthode Pandas ISNA n'a pas de paramètres impliqués. Le type de retour est un dataframe avec un booléen. Le «nan» indique les valeurs «vraies». Sinon, toutes les autres données sont cartographiées comme «fausses». Pour la mise en œuvre des codes, nous utiliserons l'outil «Spyder», qui est en langue «Python» infusée. Le pandas isna est un nouvel objet de panda dont l'objet d'entrée est de la même taille."

La syntaxe pour les pandas ISNA ()

Nous pouvons utiliser la méthode Panda ISNA sur diverses structures de données. Commencer avec la syntaxe.

Trame de données.ISNA ()

Dans la syntaxe ci-dessus de pandas isna () dataframe, nous devons simplement saisir le nom du dataframe sur lequel nous voulons travailler. Appeler la méthode est effectué en utilisant le «point ISNA."Nous pouvons également appliquer la méthode de pandas isna () aux données de la série. Pour cela, nous devons attribuer le nom de l'objet de la série avec la méthode ISNA ().

Maintenant, faisons les exemples pour une meilleure compréhension de la méthode Pandas ISNA. Voici les façons dont nous allons mettre en œuvre dans les exemples pour détecter les valeurs manquantes dans Pandas en utilisant la méthode ISNA ():

Identification des valeurs manquantes dans une colonne DataFrame à l'aide de pandas ISNA.
Identifier les valeurs manquantes dans l'ensemble des données en utilisant des pandas ISNA.
Utilisation de Pandas ISNA pour compter les valeurs nulles dans chaque colonne du DataFrame.

Création de DataFrame pour l'implémentation de Pandas ISNA ()

Tout d'abord, nous devons importer la bibliothèque Pandas car les pandas «PD» sont une bibliothèque open source pour manipuler les données, puis importer la bibliothèque Numpy en tant que «NP», qui est utilisé pour les calculs numériques des données. Après l'importation des bibliothèques, nous commencerons à créer un dataframe qui peut également être écrit comme «DF». Dans le «DF», nous avons le nom, les pays, les ventes et les dépenses. Il existe des variables «quatre» dans lesquelles 2 colonnes ont des données de caractère et les deux autres ont des données numériques. Suivi avec la commande pour imprimer les «données de vente». Le «NP.Nan »dans le code est le« NP »comme expliqué ci-dessus, et le« Nan »représente pas un nombre; Dans l'ensemble, c'est pour créer les valeurs manquantes dans le dataframe.

La sortie montre une dataframe créée en fonction des données fournies, et nous pouvons voir que certaines valeurs sont manquantes en tant que «nan». Les exemples ci-dessous que nous ferons indiqueront clairement comment résoudre ce problème.

Exemple 01: Identification des valeurs manquantes dans une colonne DataFrame à l'aide de pandas isna ()

Ici, nous identifierons les valeurs manquantes dans la colonne. Nous avons sélectionné la colonne «Sales» pour détecter ses termes manquants. Cette méthode aidera à trouver les valeurs manquantes dans la colonne que nous voulons savoir ou à travailler au lieu d'appliquer la méthode à l'ensemble des données pour se concentrer sur les termes que nous devons savoir. Nous avons le dataframe créé à partir de laquelle nous pouvons voir que dans les ventes, il manque une valeur, écrite comme «NP.nan »; il fonctionne avec la technique de vrai et faux. Il montrera les valeurs attribuées comme «fausses» et les manquantes comme «vrai».

La sortie affiche les résultats en booléen, ce qui signifie vrai et faux. Les valeurs vraies et fausses dans lesquelles nous pouvons voir clairement où la valeur manquante est écrite est «vrai».

Exemple 02: Identification des valeurs manquantes dans l'ensemble des données de données à l'aide de la méthode Pandas ISNA

Dans cet exemple, nous détecterons le terme manquant comme nous l'avons fait dans l'exemple précédent, mais ici, nous les implémenterons dans l'ensemble des données de données. Cela signifie que nous détecterons les termes manquants dans tout le «DF». Le «DF» créé a les données de vente, qui se compose du nom, du nom du pays, des ventes et des dépenses. La ligne de code suivante explique les données de vente, qui est le nom du «DF» qui lui est donné; Nous pouvons le choisir par nous-mêmes, quel nom nous donnerons à votre «DF» et ensuite, il y a le «point» ISNA () qui fonctionne, la méthode et imprime la sortie comme des termes manquants vrai et faux dans l'ensemble «DF ".

La sortie montre que l'ensemble des données est étiquetée comme «vraie» et «fausse», montrant les valeurs manquantes, telles que les ventes (3) est étiquetée comme «vraie» et les dépenses (2) sont également écrites comme «vraies», ce qui signifie Ce sont l'unité du dataframe dans lequel les données sont manquantes.

Exemple 03

Maintenant, dans cet exemple, nous ferons le comptage des valeurs dans le dataframe avec la méthode Pandas ISNA, l'accomplissement de cette méthode serait possible en utilisant deux méthodes de pandas, les pandas «ISNA» et la méthode «somme» des pandas. Comme nous le savons, ISNA () est utilisé pour identifier la valeur manquante, et la somme que nous utiliserons est pour le comptage de ces valeurs manquantes dans le «DF». Cette méthode est très bénéfique, non utilisée très souvent, mais comme l'astuce est reconnue, l'utilisation augmente car elle donne à la sortie le processus si clairement qu'il n'est pas nécessaire de compter dans chaque ligne ou chaque colonne en particulier, le nombre de sorties Rend la plus simple de comprendre le nombre des termes manquants dans le «DF».

Il s'agit d'une méthode de syntaxe délicate pour mettre deux méthodes différentes dans la même parenthèse mais avec des lignes différentes. Ceci est une technique très utile mais puissante pour les données qui se sont disputées et l'analyse effectuée sur les données. Nous pouvons appeler cela une méthode complexe, ce qui facilite le débogage et la lecture des données.

Ici, la sortie affiche la version de nombre des valeurs manquantes, ce qui indique clairement quelle colonne et combien de nombres manquent. Les ventes et la colonne de dépenses ont toutes deux des valeurs manquantes «2». Alors que le nom et le pays n'ont pas de termes manquants.

Conclusion

Dans cet article, nous avons appris toutes les façons dont les pandas ISNA () fonctionnent. Dans le «DF», c'est le moyen rapide de vérifier les valeurs manquantes. Nous avons effectué les exemples pour une meilleure compréhension de l'ensemble de la méthode des données de la méthode Pandas ISNA, car par le désir, la colonne sélectionnée Pandas ISNa méthode et la méthode du comte de Pandas Isna. Toutes ces méthodes, à grande échelle, fonctionnent pour l'amélioration et la facilité des utilisateurs car il sera difficile de détecter une valeur manquante dans des millions d'ensembles de données. Ainsi, cette approche sera une bouée de sauvetage pour tous ceux qui travaillent avec une énorme quantité de données vers tout processus de développement.

Python

Python Chmod

Le «OS.Chmod () ”La fonction du module OS est utilisée pour modifier la propriété du fichier Python ...

Lola Bonnet

Docker

Quel est le but d'un docker-compose.Fichier YML dans Docker?

Le but principal d'un «compose docker.Le fichier yml »doit simplifier le processus de déploiement et...

Lola Bonnet

Python

Convertir une chaîne en json python

La fonction du module JSON, la fonction du module «AST», ou la fonction «ev ()» est utilisée pour co...

Lena Martinez