Pandas de produits cumulatifs

Pandas de produits cumulatifs
Python est un langage de programmation de haut niveau convivial considéré comme le meilleur pour effectuer une analyse des données. La raison principale en est que Python fournit un excellent écosystème de packages centrés sur les données comme Pandas. Les pandas en python facilitent l'importation et l'analyse des données.

L'une des fonctions du panda est la série.Cumprod (). Cette méthode est utilisée pour calculer le produit cumulatif d'une série. Dans cet article, nous expliquerons comment calculer le produit cumulatif à l'aide de la bibliothèque de Panda à Python.

Qu'est-ce qu'un produit cumulatif?

Un produit cumulatif est un produit itératif de chaque élément dans un tableau. Une séquence donnée est multipliée de manière itérative par chaque élément de cette séquence. Chaque valeur résultante est la somme des valeurs actuelles et précédentes du tableau. Par exemple, nous avons une séquence de 3 éléments [x, y, z], et le produit cumulatif sera [x, xy, xyz].

Les pandas en python offrent quelques fonctions pour calculer le produit cumulatif d'une série. Cumprod () est l'une de ces fonctions couramment utilisées pour trouver le produit cumulatif d'une série en python. Un dataframe ou une série d'éléments fournis à la fonction Cumprod () calcule le produit cumulatif et renvoie la même taille de dataframe ou de série contenant le produit cumulatif.

Quelle est la syntaxe de la série.Méthode Cumprod ()?

Voici la syntaxe de la série.Méthode Cumprod ():

Les séries.Cumprod () prend deux paramètres; axe et skipna. La valeur de l'axe est de 0 ou 1; ou c'est soit index ou colonne, 0 et index, les deux représentent le fonctionnement au niveau de la ligne, tandis que 1 et la colonne représentent tous deux l'opération de colonne. De plus, la valeur Skipna est une valeur booléenne (vrai ou fausse). Il est utilisé pour sauter les valeurs NA dans un dataframe. Les séries.Cumprod () renvoie la même taille de série que l'entrée.

Maintenant, procédons avec les exemples pour voir comment nous pouvons implémenter la fonction Cumprod () dans Python.

Exemple 1

Dans cet exemple, nous créerons une petite série de nombres qui contient également une valeur NA. La valeur NA est conservée dans la série pour voir comment Cumprod () réagit. De plus, aucune valeur n'est fournie pour le paramètre Skipna, ce qui fait que le Cumprod () utilise la valeur Skipna par défaut True. Voir le code ci-dessous.

Comme indiqué précédemment, le produit cumulatif est le produit de la valeur actuelle et de toutes les valeurs précédentes dans le tableau. Le premier élément du tableau d'origine est toujours égal au premier produit cumulatif. La deuxième valeur est le produit des première et deuxième valeurs, 2 * 3 = 6, et la troisième valeur est le produit des trois premières valeurs, 2 * 3 * 5 = 30.

Maintenant, si la quatrième valeur est nan, le Skipna était vrai. Le même processus du produit cumulatif est suivi pour le reste des valeurs du tableau.

Importer des pandas en tant que PD
Importer Numpy comme NP
num = [2, 3, 5, np.NAN, 7, 9, 1, 0]
S = PD.Série (num)
Cumprod = S.Cumprod ()
Imprimer (Cumprod)

Voir la sortie suivante pour connaître le produit cumulatif de chaque valeur dans le tableau:

Exemple 2

Dans l'exemple précédent, nous n'avons pas fourni la valeur pour Skipna en gardant le Skipna True par défaut. Maintenant, nous fournirons un faux pour Skipna afin que Cumprod () ne saute pas NA, et nous pouvons voir ce qui va se passer dans ce cas.

En fournissant la fausse valeur pour Skipna, nous obligeons le Cumprod () à remarquer la valeur NA à tout moment et à le comparer à chaque fois sur sa présence. Voir le code suivant pour apprendre à fournir une fausse valeur pour le paramètre Skipna:

Importer des pandas en tant que PD
Importer Numpy comme NP
num = [2, 3, 5, np.NAN, 7, 9, 1, 0]
S = PD.Série (num)
Cumprod = S.Cumprod (skipna = false)
Imprimer (Cumprod)

Voici la sortie du code précédent:

Notez que les quatre premières valeurs sont les mêmes que l'exemple précédent. Cependant, la cinquième valeur devient NA comme nous l'avions fourni Skipna = False, ce qui signifie que NA n'est pas ignoré et comparé lorsqu'il s'est produit dans la liste. Ainsi, en faisant toutes les valeurs restantes na.

Exemple 3

Nous avons vu le produit cumulatif d'un simple tableau dans les exemples précédents. Voyons comment nous pouvons calculer le produit cumulatif d'un tableau dépendant de l'axe. Cet exemple fournira deux colonnes dans un tableau et trouvera leur produit cumulatif. Voici le code pour cela:

Importer Numpy comme NP
arr = np.Array ([[1, 3, 5, 7], [2, 4, 6, 8]])
print ("Le tableau d'entrée est =", arr)
res = np.Cumprod (ARR)
Imprimer ("Le produit cumulatif du tableau d'entrée est =", res)

Notez que le réseau résultant est la somme de la longueur des deux colonnes, qui est 4 + 4 = 8. Voir la sortie ci-dessous:

Exemple 4

Maintenant, nous savons qu'il est possible de calculer le produit cumulatif d'un tableau basé sur l'axe, nous pouvons décider si nous voulons calculer le produit cumulatif de tous les axes ou simplement l'axe 1 en même temps. Voir le code ci-dessous pour savoir comment nous pouvons y parvenir.

Comme vous pouvez l'observer, nous n'avons fourni le paramètre Axe supplémentaire à la fonction Cumprod (). La valeur du paramètre de l'axe est 1, ce qui signifie calculer le produit cumulatif de 1 axe. En termes simples, le Cumprod () prendra la première colonne, calculera son produit cumulé et retournera le résultat. Après cela, prenez la deuxième colonne, démarrez le nouveau produit cumulatif, calculez le produit cumulatif de chaque élément et renvoyez le résultat pour la deuxième colonne.

Importer Numpy comme NP
arr = np.Array ([[1, 3, 5, 7], [2, 4, 6, 8]])
print ("Le tableau d'entrée est =", arr)
res = np.Cumprod (arr, axe = 1)
Imprimer ("Le produit cumulatif du tableau d'entrée est =", res)

Voici l'image de sortie:

Conclusion

Nous avons couvert le concept fondamental de calcul du produit cumulatif dans cet article. Nous avons également mentionné des directives sur la façon de calculer le produit cumulatif à l'aide de pandas en python. Les pandas en python fournissent une fonction Cumprod () pour calculer le produit cumulatif d'une série.