Pandas interpole

Pandas interpole
L'interpolation est un moyen d'estimer les données inconnues entre les deux valeurs connues des données. La méthode Pandas «Interpolate» est utilisée pour remplir les qualités manquantes dans le DataFrame. Ce n'est pas la meilleure version pour trouver les données manquantes ou inconnues car elle peut parfois affecter la précision des données et peut avoir des erreurs à court terme. Mais il y a un «polynôme», qui est un type d'interpolate de pandas, qui est utilisé à bien des égards. Python de Pandas est un langage très utile pour les informations sur le travail lié aux données. Nous utiliserons l'outil «Spyder» pour la mise en œuvre des codes, qui est un logiciel convivial basé sur le langage Python. L'interpolation des pandas peut être effectuée dans différentes méthodes, nous devons savoir quel travail nous devons faire. Avec ces connaissances, nous mettrons en œuvre la méthode en conséquence, dont nous discuterons avec des exemples et des explications complets.

Types de pandas interpolés

Voici les trois façons dont l'interpolation des pandas peut être effectuée:

  • Interpolation linéaire des pandas (vers l'avant, vers l'arrière, les deux, une seule colonne, axe, rembourrage et polynôme).
  • Interpolation des pandas polynômes.
  • Interpolation de pandas à travers le rembourrage.

Il y a certains paramètres qui sont les suivants:

limit_direction

«Forward», «en arrière», «les deux»

La direction limite est par défaut, déposée comme «vers l'avant», ce qui signifie que si nous n'avons pas spécifié la méthode, il ira avec la méthode d'interpolation vers l'avant.

Création de DataFrame pour l'implémentation de la méthode de Pandas Interpolate

Tout d'abord, nous nous concentrerons sur la création du «DF» de Dataframe «DF». Nous avons importé la bibliothèque Pandas comme «PD», qui est une bibliothèque open source pour manipuler les données. Ensuite, nous commencerons à créer le «DF» à l'aide du logiciel «Spyder», où nous avons les données comme dans quatre variables nommées, «W», «X», «Y» et «Z». Tous ont des valeurs distinctes assignées telles que «w» qui a les valeurs «18», «5», «9», «3», «aucun». «X» a les valeurs «Aucun», «89», «4», «8» et «Aucun». «Y» a les valeurs «30», «None», «7», «9», «12». De même, «z» avec les valeurs «11», «aucun», «66», «5» et «8».

Ici, dans le code ci-dessus, le dataframe qui peut être écrit comme «DF» est créé. Dans la première ligne de code, la bibliothèque Pandas est importée comme «PD». Ensuite, le DataFrame est créé dans lequel nous avons attribué les variables «W», «X», «Y» et «Z», compte tenu de chacune de ces cinq valeurs attribuées. Le «Nan» dans le code signifie «pas un nombre».

La sortie montre les valeurs de dataframe telles que nous les avons assignées dans le code. Il y a les nombres de série, puis les variables, supprimant les valeurs comme affectées.

Exemple 01: Méthode d'interpolation linéaire des pandas avant

En interpolation linéaire, la méthode interpolate () fonctionne comme les points près de la gauche et de la droite, une fois l'estimation terminée. Ces points sont supposés rester sur le point de rencontre inconnu. Comme mentionné ci-dessus dans les paramètres, si nous ne spécifions pas le paramètre, alors il s'exécute en tant que méthode interpolée avant. Le code ci-dessous est un exemple clair de la valeur par défaut. Ici, nous avons pris les variables comme «S», «T», «U» et «V» avec leurs valeurs attribuées pour le DataFrame. Pourtant, si nous voulons spécifier par vous-même, nous pouvons aller avec le même code. Il suffit d'ajouter, après la dernière ligne de code, DF. Interpolate () peut être écrit avec la direction limite le spécifiant comme «vers l'avant», il ressemblera donc à: «DF.Interpolate (limit_direction = 'Forward') ".

La sortie ci-dessous montre l'interpolation avant du code ci-dessus. Quant aux détails donnés, la valeur par défaut fonctionne comme «interpolation vers l'avant», c'est pourquoi le T (0) affiche la valeur nul.

Exemple 02: Méthode d'interpolation linéaire des pandas vers l'arrière

Si nous voulons faire l'interpolation linéaire vers l'arrière, nous pouvons le faire de la même manière, comme nous l'avons fait ci-dessus dans l'interpolation avant. Nous devons donner la direction limite comme «en arrière», cette fois, comme indiqué dans le code. Ici, les variables sur lesquelles nous travaillerons pour le DF sont: «D», «Q», «B» et «J» avec leurs valeurs attribuées.

La sortie de la méthode d'interpolation vers l'arrière, le Q (4) est nul en raison de la méthode d'interpolation vers l'arrière effectuée.

Exemple 03: les deux méthodes d'interpolation des pandas linéaires

Maintenant ici, et si nous voulons faire l'avant et l'arrière sur le même code? C'est possible et nous pouvons le faire simplement en utilisant la méthode d'interpolation «à la fois». Ici, pour le «DF», nous avons les variables «P», «U», «O» et «M» avec leurs valeurs correspondantes attribuées.

La sortie suivante se compose des deux, la méthode d'interpolation vers l'avant et vers l'arrière.

Exemple 04: Méthode d'interpolation des pandas à colonne unique

Nous pouvons également appliquer la méthode interpolée sur une seule colonne comme souhaité. Pour la création de dataframe, nous avons utilisé les variables «N», «M», «O» et «P» avec les valeurs attribuées. La colonne «N» est sélectionnée dans le «DF» à afficher avec la méthode Interpolate ().

La sortie ici affiche l'interpolation de pandas à colonne unique.

Exemple 05: Méthode d'interpolation des pandas Axis

Parfois, selon le besoin, nous voulons interpoler par colonne et parfois par les lignes afin que l'attribut «axe» fonctionne à son meilleur. Cette fonction est défini par défaut comme colonne une alors, si nous voulons que les lignes interpolent, nous devons suivre explicitement l'axe comme 1. Les «L», «F», «I» et «T» sont des variables attribuées dans ce «DF» avec leurs valeurs en conséquence.

La sortie de l'axe interpolate ():

Exemple 06: Méthode d'interpolation des pandas polynomiales

En mathématiques, un polynôme est une expression qui se compose d'indéterminer, qui sont également appelées variables et coefficients qui effectuent les opérations arithmétiques. Dans l'interpolation, il y a des chances d'erreurs qui peuvent se produire ici et là parfois. Tandis que l'interpolation polynomiale est la meilleure pratique qui se déroule sur les données de la série. Les données prises ici sont en série: «4», «5», «6», «np. nan ”,« 8 »et« 9 »suivi avec la méthode interpolée du polynôme. NP.Nan est défini comme NP de la bibliothèque Panda et «Nan» est indiqué comme «pas un nombre».

Le résultat affiche la méthode interpolate des pandas polynomiales:

Exemple 07: Interpolation des pandas avec rembourrage

L'interpolation de panda avec un rembourrage est définie comme «écrire ou copier une valeur respectivement avant un point manquant». Dans cette méthode, la spécification de la limite doit être approchée. La limite doit être le nombre maximum de «NANS» car il le remplira en continu. Cette méthode fonctionne dans la direction avant uniquement et aussi dans les données de la série. Le «DF» de cette méthode est dans la série en tant que «2», «3», «NP. Nan "," 5 "," 6 "," 7 "et" 8 "suivi avec la méthode" Pad "pour le rembourrage.

Les résultats de sortie montrent l'interpolation des pandas à travers le «rembourrage».

Conclusion

La méthode interpolate de Pandas est une méthode très pratique pour remplir le «nan» ou les valeurs qui manquent. Dans cet article, nous avons appris divers types d'interpolation dans Pandas Dataframe - que ce soit en avant, en arrière, ou les deux, avec axe, polynôme et enfin la méthode de rembourrage. Tous sont utilisés dans un but spécifique et la facilité des utilisateurs travaillant sur d'énormes quantités de données.