Fonction Signum ()
La fonction Signum () est une fonction mathématique utilisée dans Pyspark. Il est disponible dans le pyspark.SQL.module de fonctions.
Il peut être utilisé avec la méthode SELECT car SELECT () affiche les valeurs du signal dans le Pyspark DataFrame.
Syntaxe:
dataframe_obj.SELECT (Signum (dataframe_obj.colonne))
Paramètre:
Il prend le nom de colonne comme paramètre pour retourner les valeurs de signaux pour cette colonne.
Maintenant, nous verrons quelques exemples pour mieux comprendre cette fonction.
Exemple 1
Créons un pyspark dataframe avec 3 lignes et 4 colonnes, plus tous les types numériques et les valeurs de signaux de retour.
Sortir:
Donc, pour la valeur de la colonne1, nous avons renvoyé les valeurs de signaux.
3.141592653589793 est supérieur à 0. Donc, le signal est 1.
1.5707963267948966 est supérieur à 0. Donc, le signal est 1.
1.0471975511965976 est supérieur à 0. Donc, le signal est 1.
Exemple 2
Maintenant, nous retournerons les valeurs de signaux pour les colonnes de valeur 2 et de valeur.
Sortir:
Colonne - Value2:
0 est 0. Donc, le signal est 0.
1 est supérieur à 0. Donc, le signal est 1.
-5 est inférieur à 0. Donc, le signal est -1.
Colonne - Value3:
7.8 est supérieur à 0. Donc, le signal est 1.
0.5 est supérieur à 0. Donc, le signal est 1.
-12.9 est inférieur à 0. Donc, le signal est -1.
Note: La fonction Signum () retournera null si vous l'appliquez en valeurs de chaîne. Cela ne fonctionne que sur les données numériques.
Conclusion
Dans ce tutoriel Pyspark, nous avons discuté de la fonction Signum (). Signum () est une fonction mathématique qui peut être utilisée dans Pyspark. Il est disponible dans le pyspark.SQL.module de fonctions. Dans une colonne DataFrame, si la valeur est inférieure à 0, alors le signal renvoie -1. Si la valeur est égale à 0, le signal renvoie 0. Sinon, il renvoie 1.