Fonction Signum Pyspark

Fonction Signum Pyspark
Le principal avantage de la fonction Signum est de fournir un signe aux valeurs données. Dans Pyspark DataFrame avec les colonnes numériques, si la valeur est inférieure à 0, le signal renvoie -1. Si la valeur est égale à 0, alors le signal renvoie 0. Sinon, il renvoie 1.

Fonction Signum ()

La fonction Signum () est une fonction mathématique utilisée dans Pyspark. Il est disponible dans le pyspark.SQL.module de fonctions.

Il peut être utilisé avec la méthode SELECT car SELECT () affiche les valeurs du signal dans le Pyspark DataFrame.

Syntaxe:
dataframe_obj.SELECT (Signum (dataframe_obj.colonne))

Paramètre:
Il prend le nom de colonne comme paramètre pour retourner les valeurs de signaux pour cette colonne.

Maintenant, nous verrons quelques exemples pour mieux comprendre cette fonction.

Exemple 1
Créons un pyspark dataframe avec 3 lignes et 4 colonnes, plus tous les types numériques et les valeurs de signaux de retour.

Importer Pyspark
mathématiques d'importation
de Pyspark.SQL IMPORT SPARKSESSE
de Pyspark.SQL.Fonctions Import Signum
Spark_App = Sparkcession.constructeur.nom de l'application('_').getorCreate ()
#Create Math Valed
valeurs = [(mathématiques.pi, 0,7.8 120),
(mathématiques.pi / 2,1,0.5 180),
(mathématiques.pi / 3, -5, -12.9 360)
]]
#assign colonnes en créant le pyspark dataframe
dataframe_obj = spark_app.CreatedataFrame (valeurs, ['Value1', 'Value2', 'Value3', 'Value4'])
dataframe_obj.montrer()
#get la colonne Signaux Valeurs de Valeur1
dataframe_obj.SELECT (Signum (dataframe_obj.valeur 1)).montrer()

Sortir:

Donc, pour la valeur de la colonne1, nous avons renvoyé les valeurs de signaux.
3.141592653589793 est supérieur à 0. Donc, le signal est 1.
1.5707963267948966 est supérieur à 0. Donc, le signal est 1.
1.0471975511965976 est supérieur à 0. Donc, le signal est 1.

Exemple 2
Maintenant, nous retournerons les valeurs de signaux pour les colonnes de valeur 2 et de valeur.

Importer Pyspark
mathématiques d'importation
de Pyspark.SQL IMPORT SPARKSESSE
de Pyspark.SQL.Fonctions Import Signum
Spark_App = Sparkcession.constructeur.nom de l'application('_').getorCreate ()
#Create Math Valed
valeurs = [(mathématiques.pi, 0,7.8 120),
(mathématiques.pi / 2,1,0.5 180),
(mathématiques.pi / 3, -5, -12.9 360)
]]
#assign colonnes en créant le pyspark dataframe
dataframe_obj = spark_app.CreatedataFrame (valeurs, ['Value1', 'Value2', 'Value3', 'Value4'])
dataframe_obj.montrer()
#get les valeurs signal de la colonne de valeur 2 et de valeur3
dataframe_obj.SELECT (Signum (dataframe_obj.Value2), Signum (dataframe_obj.valeur3)).montrer()

Sortir:

Colonne - Value2:

0 est 0. Donc, le signal est 0.
1 est supérieur à 0. Donc, le signal est 1.
-5 est inférieur à 0. Donc, le signal est -1.

Colonne - Value3:

7.8 est supérieur à 0. Donc, le signal est 1.
0.5 est supérieur à 0. Donc, le signal est 1.
-12.9 est inférieur à 0. Donc, le signal est -1.

Note: La fonction Signum () retournera null si vous l'appliquez en valeurs de chaîne. Cela ne fonctionne que sur les données numériques.

Conclusion

Dans ce tutoriel Pyspark, nous avons discuté de la fonction Signum (). Signum () est une fonction mathématique qui peut être utilisée dans Pyspark. Il est disponible dans le pyspark.SQL.module de fonctions. Dans une colonne DataFrame, si la valeur est inférieure à 0, alors le signal renvoie -1. Si la valeur est égale à 0, le signal renvoie 0. Sinon, il renvoie 1.