Pandas roulant moyen

Pandas roulant moyen

«La fonctionnalité de calcul de la fenêtre de roulement est fournie par les Pandas« DataFrame.roulant().Méthode moyenne () ». La moyenne d'un nombre spécifié d'intervalles antérieurs dans une série temporelle est connu comme une moyenne roulante."

La syntaxe suivante peut être utilisée pour déterminer la moyenne de roulement pour les colonnes uniques ou multiples dans un Pandas DataFrame:

Nous explorerons différentes techniques pour utiliser cette méthode dans cette leçon.

Exemple 1

Dans cette illustration, nous utiliserons les Pandas «DF.roulant().Méthode moyenne () ”pour calculer la moyenne de roulement d'une seule colonne.

Nous devons d'abord saisir les exigences pour la compilation du code. Nous avons besoin d'un logiciel qui nous fournit un environnement pris en charge Python pour compiler notre script Python. Nous avons installé l'outil «Spyder» dans notre système. Après avoir lancé l'outil, nous pouvons accéder à l'interface.

En commençant par le programme, nous devons initialement charger la bibliothèque essentielle. La méthode «Rolling ()» sur laquelle est basé sur notre article est la fonction Pandas. Ainsi, pour utiliser cette méthode dans notre programme, nous devons importer la bibliothèque «Pandas» et créer «PD» comme alias pour «pandas».

Une fois la condition préalable obtenue, nous devons générer un Pandas DataFrame en utilisant le «PD.Module DataFrame () »fourni par la boîte à outils Pandas. Le «PD.La méthode DataFrame () »est invoquée avec 4 colonnes que nous avons spécifiées comme« été »,« hiver »,« automne »et« printemps ». Chaque colonne stocke 8 valeurs. Les valeurs identifiées pour la colonne «d'été» sont «200», «130», «280», «100», «270», «360», «120» et «311». La colonne «hiver» a ces valeurs «12», «34», «54», «67», «98», «45», «78» et «43». La troisième colonne, «Autumn», a des valeurs comme «12», «13», «42», «32», «71», «61», «77» et «89». Pour la colonne «Spring», les valeurs sont «10», «29», «78», «44», «76», «55», «32» et «22».

Le «PD.DataFrame () ”, lorsqu'il est invoqué, construit un dataframe en utilisant ces valeurs fournies. Il a ensuite besoin d'un espace de stockage où il peut mettre cette dataframe pour une utilisation ultérieure. Le NEVAL DATAFRAME est désormais accessible en mentionnant l'objet «saison». L'exigence suivante consiste à afficher ce dataframe à l'écran afin que nous puissions le voir correctement. Pour cela, nous avons utilisé la méthode «print ()» de Python. Entre ses parenthèses, nous fournissons l'entrée qui doit être affichée. Ici, nous avons fourni l'objet «Saison» comme entrée à la méthode «print ()» pour afficher son contenu.

Pour exécuter le script susmentionné, nous devons appuyer sur l'option «Exécuter le fichier»; Alternativement, vous pouvez également appuyer ensemble les touches «Shift + Enter» pour exécuter le code. Cela nous donne un dataframe avec 4 colonnes et 8 lignes. La liste d'index commence à partir de «0» par défaut et se termine à «7».

Maintenant, nous allons exercer la méthode Pandas «Rolling ()» pour calculer le roulement estimé d'une seule colonne dans le dataframe fourni. Apprenons à obtenir ceci.

Nous avons invoqué le «DF.Méthode Rolling () ”. Le nom de DataFrame «Saison» avec le «.Rolling () »La méthode est écrite. Comme nous voulons obtenir la fenêtre de roulement pour le calcul de la moyenne de roulement d'une seule colonne, nous devons spécifier le nom de la colonne avec le nom de DataFrame. La colonne que nous avons choisie ici est la colonne «d'été» de la «saison» DataFrame. Entre les supports ronds de la méthode «Rolling ()», nous avons défini la valeur «3». Cela signifie que nous voulons calculer le roulement de la colonne «d'été».

Le ".La fonction moyenne () »calculera la moyenne du roulement de 3 jours de« l'été ». Nous voulons stocker cette moyenne roulante estimée de la colonne «d'été» dans une nouvelle colonne. Ainsi, pour créer une nouvelle colonne, nous avons écrit le nom de DataFrame, l'opérateur d'indice, puis le nouveau nom de colonne comme "Summer_Rolling". Nous l'avons attribué le résultat de «Saison [« Summer »].rouler (3).Fonction moyenne () ”. Par conséquent, la moyenne roulante pendant 3 jours des valeurs de la colonne «d'été» sera stockée dans la colonne «Summer_Rolling». Enfin, imprimez le dataframe en invoquant la méthode «print ()».

Dans l'instantané donné, nous pouvons voir que les deux premières entrées que nous obtenons sont des valeurs nulles. En effet, nous ne pouvons pas estimer la moyenne de roulement car elle ne peut être calculée que lorsque nous avons une fenêtre de 3 jours, mais pour les deux premiers enregistrements, nous n'avons pas de valeurs précédentes pour compléter les fenêtres spécifiées; Par conséquent, les valeurs NAN sont renvoyées. Dans le 3rd Row, nous obtenons une valeur «203.333333 ”, qui est le roulement moyen pour les 3 jours.

Exemple n ° 2

Nous avons appris à trouver la moyenne roulante d'une colonne dans un pandas dataframe. La moyenne roulante peut également être calculée pour plusieurs colonnes. Pour plusieurs colonnes, nous devons invoquer séparément la méthode moyenne de roulement pour chaque colonne.

Nous allons exercer la méthode de roulement sur le dataframe de données généré précédemment pour estimer la moyenne de roulement de plusieurs colonnes. Le «DF.roulant().La méthode moyenne () »est invoquée. Nous avons invoqué cette méthode deux fois parce que nous voulons calculer la moyenne de roulement pour deux colonnes. Le premier «Rolling ().Mean () "La méthode est appelée DataFrame et le nom de la colonne comme" Saison ['Summer'] "et la valeur des jours de roulement est spécifié" 4 ".

Pour stocker la moyenne de roulement calculée dans une autre colonne, nous avons initialisé une colonne «Summer_Rolling». Cela signifie que nous voulons calculer le moyen de roulement pour une fenêtre de 4 jours de la colonne «d'été» et stocker le résultat dans la colonne «Summer_Rolling». Ensuite, nous avons utilisé le 2nd «DF.roulant().Méthode moyenne () ». La colonne que nous avons sélectionnée ici est «automne», et la fenêtre de roulement est spécifiée comme «4». Pour enregistrer les calculs, nous avons créé une colonne «Autumn_Rolling» dans la «saison» de données de données existante. La méthode «print ()» affichera la sortie finale de la console Python.

Dans l'écran de sortie, il peut être examiné que 2 nouvelles colonnes ont été ajoutées au DataFrame. Les colonnes «Summer_Rolling» et «Autumn_Rolling» contiennent une moyenne de roulement estimée pour les colonnes «d'été» et «automne», respectivement. Les 3 premières valeurs dans les deux colonnes sont NAN car elles n'ont pas suffisamment d'entrées pour terminer la fenêtre de 4 jours pour calculer la moyenne de roulement. Du 4e Entrée, il obtient sa première valeur moyenne roulante.

Exemple n ° 3

La moyenne roulante de l'ensemble des colonnes dans le dataframe est calculée à l'aide des pandas «df.roulant().Méthode moyenne () »comme étape finale.

Pour calculer la moyenne roulante de toutes les colonnes, nous n'avons pas besoin de mentionner spécifiquement le nom d'une colonne. Nous avons invoqué le «DF.roulant().Fonction Mean () ”en fournissant simplement le nom de DataFrame comme« saison »et la valeur de la fenêtre roulante comme« 5 ». Pour préserver le résultat, nous avons créé un «résultat» variable. Le «Rolling ().La méthode moyenne () ”calculera la moyenne roulante de la« saison »de DataFrame en prenant une fenêtre de 5 jours et en stockant le résultat de la copie de DataFrame en utilisant la variable« Résultat ». Nous avons utilisé la méthode «print ()» de Python pour montrer le nouveau DataFrame.

Cela nous donne le dataframe avec une moyenne de roulement estimée pour une fenêtre de 5 jours.

Conclusion

Le calcul de la moyenne roulante pour la fenêtre spécifiée dans une dataframe est une approche simple. Nous avons utilisé les Pandas «DF.roulant().Méthode moyenne () »pour estimer la moyenne roulante dans ce tutoriel. Trois stratégies différentes ont été discutées pour trouver la moyenne de roulement dans un dataframe. La première illustration est basée sur le calcul de la moyenne de roulement d'une seule colonne, le 2nd L'exemple donne l'idée de calculer la moyenne roulante pour plusieurs colonnes, et le dernier cas est brièvement passé par la recherche de la moyenne roulante de toutes les colonnes présentes dans le dataframe. Toutes les techniques ont été pratiquement mises en œuvre sur l'outil Spyder.