Pandas bfill

Pandas bfill
«Dans Pandas DataFrame, les valeurs manquantes de l'ensemble de données sont remplies en arrière à l'aide du DataFrame.fonction bfill (). Dans le Pandas DataFrame, s'il existe des valeurs manquantes, il remplira les valeurs NAN de notre NAN. Un tableau unidimensionnel avec des étiquettes d'axe est la série Pandas. Les étiquettes doivent être un type hashable; Ils n'ont pas besoin d'être distinctifs. L'objet a un large éventail de méthodes pour exécuter les opérations nécessitant l'index et prend en charge à la fois l'indexation basée sur les étiquettes et l'indexation. La technique de remplissage vers l'arrière est utilisée pour remplir les valeurs NAN dans l'objet de la série à l'aide de la série.Fonction BFill () dans Pandas."

Syntaxe pour utiliser la méthode bfill ()?

La syntaxe de la fonction bFill () pour le dataframe est la suivante.

Syntaxe:


La syntaxe pour l'utilisation de la fonction bfill () en série est tout à fait la même qu'avec le dataframe. La différence est que le nom de la série sera utilisé, suivi de la méthode bfill ().

Syntaxe:

Paramètres

Axe: 0 ou index

1 et les colonnes ne sont pas prises en charge. Axe = 1 en série

En place: booléen, faux par défaut.

Apporter des modifications au même objet.

Limite: int, aucun par défaut

Le nombre maximum de valeurs NAN successives pour remplir les avantages en avant ou en arrière si la méthode est fournie. En d'autres termes, l'écart sera comblé partiellement s'il y a plus que de nombreux NAN consécutifs. Il s'agit du plus grand nombre d'entrées le long de l'axe complet où les entrées nulles ou manquantes seront remplies si la méthode n'est pas fournie. Il a 0 ou plus si aucun.

Retour: DataFrame ou série. Entrées NA remplies de dataframe ou de série.

Comment utiliser la méthode Pandas BFill ()?

Nous allons montrer comment utiliser la fonction BFill () dans Pandas DataFrames et Series dans les exemples qui suivent.

Exemple n ° 1: Remplissant les valeurs manquantes de DataFrame à l'aide de la fonction BFill ()

Comme nous le savons déjà, pour remplir les valeurs de NA dans un DataFrame, le DataFrame.La méthode bfill () est utilisée. Dans le sens inverse, il remplit les valeurs NAN qui existent dans le dataframe.

Tout d'abord, nous créerons le DataFrame après l'importation des modules Pandas. Pour créer le DataFrame dans Pandas, nous utiliserons le PD.Fonction DataFrame (). Les paramètres suivants seront passés dans le PD.Fonction DataFrame () pour créer le DataFrame requis.


Comme on peut le voir, nous avons créé 3 colonnes x, y et z. Dans chacune de nos colonnes DF Dataframe, des valeurs manquantes sont présentes. Pour visualiser le dataframe, nous passerons le dataframe dans la fonction print () comme un argument.


Nous allons maintenant appliquer la méthode BFill () pour remplir les cellules NA dans notre DataFrame. La valeur dans les cellules NA actuelles est peuplée à partir de la valeur correspondante dans la ligne suivante lorsque l'axe = «lignes». La ligne suivante ne sera pas remplie si la ligne suivante a également une valeur NA.

Comme vous pouvez le voir, dans le 4e Row, le 1St la cellule est toujours nan. En effet. Le 5e la valeur est nan car il n'y a pas de valeur correspondante dans la ligne inférieure à partir de laquelle la fonction bfill () peut remplir la cellule NA.

Et si nous utilisons Axis = «Colonnes»? La fonction BFill () remplira les cellules nulles avec les valeurs correspondantes de la colonne suivante (la colonne de droite). Identique à ce que dans le cas de l'axe = «lignes», la colonne suivante ne sera pas remplie si la colonne suivante a également une valeur NA.


Dans le dataframe ci-dessus, après avoir utilisé la fonction BFill (), toutes les valeurs ayant une valeur correspondante dans la colonne suivante ont été modifiées.

Exemple n ° 2: Remplissant les valeurs manquantes du booléen Dataframe à l'aide de la fonction bfill ()

Dans cet exemple, nous créerons un DataFrame avec des données booléennes et des valeurs NAN pour vérifier comment la fonction BFill () fonctionnera sur un booléen DataFrame.


Nous avons créé le dataframe avec des valeurs booléennes. Maintenant, la fonction bfill () sera utilisée pour remplir les valeurs NA.


Les cellules NA sont remplies lorsque les valeurs correspondantes dans la ligne suivante du dataframe existent et ne sont pas des valeurs nulles. Nous pouvons également spécifier axis = «colonnes» comme nous l'avons fait dans l'exemple n ° 1 pour remplir la cellule vide par la valeur dans la colonne correspondante de la cellule NA.

Exemple # 3: remplir les valeurs manquantes dans l'objet série à l'aide de la fonction BFill ()

Nous avons vu comment le bfill () fonctionne dans DataFrames. Maintenant, nous utiliserons la fonction BFill () dans un objet de série avec une ou plusieurs valeurs nulles. Tout d'abord, nous créerons une série d'une personne et spécifierons le nom d'index de chaque valeur de la série.


Nous utiliserons la fonction print () pour démontrer notre série «S».


Comme on peut le voir, il y a une cellule NA à l'index D. Pour remplir cette cellule NA; Nous utiliserons la méthode bfill () sur notre série.


Comme vous pouvez le voir, la cellule NA est remplie par la valeur suivante suivante dans la série. Comme il n'y a qu'un seul axe dans la série, il remplira toujours les valeurs manquantes par la valeur suivante à la cellule manquante.

Exemple # 4: Remplissant les valeurs manquantes dans l'objet série avec des valeurs numériques à l'aide de la fonction bFill ()

Après avoir importé les modules Pandas, maintenant, nous utiliserons la fonction BFill () sur un objet série avec des valeurs numériques et avoir une ou plusieurs valeurs nuls. Tout d'abord, nous créerons une série numérique et spécifierons l'index pour chaque valeur de la série.


Nous avons créé la série requise et spécifié l'index de chaque valeur à l'aide du PD.Fonction Date_range (). Pour obtenir un DateTimeIndex avec une fréquence fixe, la méthode date_range () est utilisée. Tandis que Freq = «M» indique que la série doit être créée en fonction du mois. Visualisez notre série à l'aide de la fonction print ().


Comme vous pouvez le voir, il y a plusieurs valeurs NA dans notre série. Nous allons maintenant remplir ces cellules nulles en utilisant la fonction bfill ().


La technique de remplissage vers l'arrière est utilisée dans la fonction BFill () pour remplir les cellules nulles par la prochaine valeur adjacente de la série.

Exemple n ° 5: Spécifiez la limite de la fonction BFill () dans l'objet série

Dans cet exemple, nous créerons une série avec plus d'une valeur consécutive pour vous montrer comment le paramètre limite fonctionne dans la fonction BFill ().


Utilisons la fonction bfill () sur la série avec le paramètre limite.


La série dans l'exemple susmentionné a deux et trois valeurs manquantes consécutives, mais parce que la limite est fixée à 2, la «série.La méthode BFill () ”n'a rempli que deux cellules nulles consécutives; Le troisième est resté nul. Si nous fixons la limite sur 3, il remplira trois cellules nulles consécutives de la série.

Spécions en outre l'argument «inplace = true» pour la série.fonction bfill (). Les séries.La méthode bfill () remplit les valeurs manquantes sans générer un nouvel objet tant que cette option est vraie et qu'elle ne renvoie aucune.


Comme vous pouvez le voir, il a rempli toutes les cellules NA de notre série.

Conclusion

Nous avons appris à utiliser la série Python Pandas «.Fonction bfill () ”dans ce tutoriel. Nous avons étudié la syntaxe et les paramètres de la fonction BFill () avant de l'utiliser sur une série et des dataframes composés de valeurs NAN pour comprendre comment le DataFrame.bfill () et série.La fonction BFill () rembourse les valeurs nulles qui existent dans le Pandas DataFrame et la série respectivement.