La série Pyspark - Pandas représente la série Pandas, mais elle détient la colonne Pyspark en interne.
Pandas Support Series Structure de données et Pandas est importé du module Pyspark.
Avant cela, vous devez installer le module Pyspark."
Commande
pip install pysparkSyntaxe à importer
De Pyspark Import PandasAprès cela, nous pouvons créer ou utiliser la série à partir du module Pandas.
Syntaxe pour créer des séries Pandas
pyspark.pandas.Série()Nous pouvons passer une liste ou une liste de listes avec des valeurs.
Créons une série Pandas via Pyspark qui a cinq valeurs numériques.
#Import Pandas du module PysparkSortir
Maintenant, nous allons entrer dans notre tutoriel.
Les opérations cumulatives sont utilisées pour retourner les résultats cumulatifs à travers les valeurs de la série Pyspark Pandas.
Voyons-les un par un.
pyspark.pandas.Série.cumsum ()
cumsum () retournera la somme cumulative de la série pour chaque élément. Il peut être appliqué à toute la série Pyspark Pandas.
Syntaxe
pyspark_series.cumsum ()Où Pyspark_Series est la série Pyspark Pandas
Exemple
Dans cet exemple, nous effectuerons une opération de somme cumulative sur la série.
Sortir
Fonctionnement:pyspark.pandas.Série.Cumprod ()
Cumprod () retournera le produit cumulatif de la série pour chaque élément. Il peut être appliqué à toute la série Pyspark Pandas.
Syntaxe
pyspark_series.Cumprod ()Où Pyspark_Series est la série Pyspark Pandas
Exemple
Dans cet exemple, nous effectuerons une opération de produit cumulatif sur la série.
Sortir
Fonctionnement:pyspark.pandas.Série.Cummin ()
Cummin () renvoie la valeur minimale cumulée de la série pour chaque élément. Il peut être appliqué à toute la série Pyspark Pandas.
Syntaxe
pyspark_series.Cummin ()Où Pyspark_Series est la série Pyspark Pandas
Exemple
Dans cet exemple, nous effectuerons une opération Cumulative Min sur la série.
Sortir
Fonctionnement:pyspark.pandas.Série.Cummin ()
Cummin () renvoie la valeur minimale cumulée de la série pour chaque élément. Il peut être appliqué à toute la série Pyspark Pandas.
Syntaxe
pyspark_series.Cummax ()Où Pyspark_Series est la série Pyspark Pandas
Exemple
Dans cet exemple, nous effectuerons une opération maximale cumulative sur la série.
Sortir
Fonctionnement:Conclusion
Dans ce didacticiel Pyspark Pandas, nous avons discuté des opérations cumulatives effectuées sur la série Pyspark Pandas. cumsum () est utilisé pour retourner la somme cumulative, Cumprod () est utilisé pour retourner le produit cumulatif dans, Cummin () est utilisé pour retourner la valeur minimale cumulative, et Cummax () est utilisé pour retourner la valeur maximale cumulative.