Pyspark - Pandas DataFrame représente le Pandas DataFrame, mais il contient le Pyspark DataFrame en interne.
Pandas prend en charge la structure des données DataFrame et Pandas est importé du module Pyspark.
Avant cela, vous devez installer le module Pyspark."
Commande
pip install pysparkSyntaxe à importer
De Pyspark Import PandasAprès cela, nous pouvons créer ou utiliser le DataFrame à partir du module Pandas.
Syntaxe pour créer Pandas DataFrame:
pyspark.pandas.Trame de données()Nous pouvons passer un dictionnaire ou une liste de listes avec des valeurs.
Créons un Pandas DataFrame via Pyspark qui a quatre colonnes et cinq lignes.
#Import Pandas du module PysparkSortir
Maintenant, nous allons entrer dans notre tutoriel.
Les fonctions isna (), notna () et notnull () sont utilisées pour vérifier si aucune des valeurs ne s'est produite dans Pyspark Pandas DataFrame. Ils sont représentés par NAN (pas un nombre); Dans Python, nous pouvons les créer en utilisant aucun.
Voyons-les un par un.
pyspark.pandas.Trame de données.ISNA
ISNA est utilisé pour vérifier si la valeur est nul. S'il est nul, alors il reviendra vrai à cette valeur. Sinon, il renvoie faux. Il ne prend aucun paramètre.
Syntaxe
pyspark_pandas.ISNAOù pyspark_pandas est le pyspark pandas dataframe.
Nous pouvons également vérifier dans des colonnes particulières.
Syntaxe
pyspark_pandas.colonne.ISNAOù la colonne est le nom de la colonne.
Exemple 1
Dans cet exemple, nous vérifierons les valeurs NAN dans la colonne Mark1 en utilisant ISNA.
Sortir
0 fauxNous pouvons voir que dans la deuxième et la troisième rangée - Nan est disponible, donc à ces positions, ISNA est revenu vrai. Dans d'autres cas, il est revenu faux.
Exemple 2
Dans cet exemple, nous vérifierons les valeurs NAN dans l'ensemble du Pyspark Pandas DataFrame en utilisant ISNA.
Sortir
Student_lastName Mark1 Mark2 Mark3Nous pouvons voir que Isna revient vrai partout où Nan existe.
pyspark.pandas.Trame de données.notna
Notna est utilisé pour vérifier si la valeur n'est pas nul. S'il est nul, il reviendra faux à cette valeur. Sinon, il renvoie vrai. Il ne prend aucun paramètre.
Syntaxe
pyspark_pandas.notnaOù pyspark_pandas est le pyspark pandas dataframe.
Nous pouvons également vérifier dans des colonnes particulières.
Syntaxe
pyspark_pandas.colonne.notnaOù la colonne est le nom de la colonne.
Exemple 1
Dans cet exemple, nous vérifierons les valeurs NAN dans la colonne Mark1 en utilisant Notna.
Sortir
0 vraiNous pouvons voir que dans la deuxième et la troisième rangée - Nan n'est pas disponible, donc à ces positions, Notna est retourné faux. Dans d'autres cas, il est revenu vrai.
Exemple 2
Dans cet exemple, nous vérifierons les valeurs NAN dans l'ensemble du Pyspark Pandas DataFrame en utilisant ISNA.
Sortir
Student_lastName Mark1 Mark2 Mark3Nous pouvons voir que Notna revient faux partout où nan existe.
pyspark.pandas.Trame de données.notnull
Notnull est similaire à Notna utilisé pour vérifier si la valeur n'est pas nul. S'il est nul, il reviendra faux à cette valeur. Sinon, il renvoie vrai. Il ne prend aucun paramètre.
Syntaxe
pyspark_pandas.notnullOù pyspark_pandas est le pyspark pandas dataframe.
Nous pouvons également vérifier dans des colonnes particulières.
Syntaxe
pyspark_pandas.colonne.notnullOù la colonne est le nom de la colonne.
Exemple 1
Dans cet exemple, nous vérifierons les valeurs NAN dans la colonne Mark1 en utilisant Notnull.
Sortir
0 vraiNous pouvons voir que dans la deuxième et la troisième rangée - Nan n'est pas disponible, donc à ces positions, Notnull est revenu faux. Dans d'autres cas, il est revenu vrai.
Exemple 2
Dans cet exemple, nous vérifierons les valeurs NAN dans l'ensemble du Pyspark Pandas DataFrame en utilisant Notnull.
Sortir
Student_lastName Mark1 Mark2 Mark3Nous pouvons voir que Notnull revient faux partout où nan existe.
Conclusion
Dans ce didacticiel Pyspark Pandas Dataframe, nous avons vu comment vérifier les valeurs NAN dans le DataFrame. ISNA est utilisé pour revenir vrai s'il est nan, et Notna et Notnull fonctionneront de la même manière en renvoyant vrai si la valeur n'est pas nan.