Tableaux masqués scipy

Tableaux masqués scipy

Lorsque vous souhaitez effectuer un calcul statistique ou scientifique à Python, vous courez toujours vers la bibliothèque Scipy. La bibliothèque Scipy est l'une des bibliothèques Python les plus couramment utilisées car elle offre une fonction appropriée pour tous les types de calculs mathématiques, statistiques et scientifiques. Ce n'est pas seulement une bibliothèque, mais un écosystème entier de bibliothèques qui sont combinés afin que vous puissiez effectuer une tâche simple ou complexe facilement et rapidement. Ce guide vous permettra d'explorer les fonctions Scipy qui peuvent être utilisées avec des tableaux masqués.

Qu'est-ce qu'un tableau masqué?

Un tableau masqué est un tableau qui peut avoir des entrées non valides ou manquantes. Dans divers événements, les ensembles de données ou les tableaux peuvent être entachés ou incomplets par la présence de données non valides. Par exemple, un capteur a enregistré des données non valides pour des raisons multiples ou elle peut avoir échoué à enregistrer des données. Maintenant, nous avons soit un ensemble de données vide, soit un ensemble de données plein d'entrées non valides. Le moyen simple de gérer de tels ensembles de données est de masquer ces tableaux. La bibliothèque Numpy offre une fonction de masquage simple pour masquer ces types de tableaux. La bibliothèque Scipy elle-même ne fournit aucune fonction de masquage qui peut être utilisée pour masquer un ensemble de données. Cependant, il fournit de nombreuses fonctions à utiliser avec les tableaux de masque.

Dans ce guide, nous vous guiderons d'abord sur la façon dont vous pouvez utiliser la bibliothèque Numpy pour masquer un ensemble de données. Ensuite, nous montrerons comment les fonctions de la bibliothèque Scipy peuvent être utilisées avec des tableaux masqués. Dans Numpy, le tableau masqué est une combinaison d'un ndarray standard et d'un masque. La valeur du masque peut être soit nomasque, soit une liste de booléens qui spécifient le masquage pour chaque valeur de l'ensemble de données. Par exemple, si vous spécifiez le nomasque pour la valeur du masque, cela signifie qu'il n'y a pas de valeur non valide dans l'ensemble de données. Alors que si vous spécifiez un tableau booléen pour l'ensemble de données, chaque valeur détermine la valeur valide ou non valide associée à l'ensemble de données donné. Si la valeur du masque est fausse, la valeur correspondante dans l'ensemble de données est valide, donc elle ne sera pas masquée. Si la valeur du masque est vraie, la valeur correspondante n'est pas valide, donc elle sera masquée. Maintenant, voyons un exemple pour avoir une compréhension claire.

Exemple 1:

Dans cet exemple, nous vous guiderons sur la façon de masquer un tableau avec la fonction de masquage Numpy. Nous explorerons comment le «Numpy.La fonction ma ”fonctionne dans un programme afin de masquer un ensemble de données donné. Considérez l'exemple de code donné:

Importer Numpy comme NP
Importer Numpy.ma comme ma
données = np.Array ([2, 5, 8, -9, -7])
masque = mA.masqued_array (données, masque = [0, 0, 0, 1, 1],
dtype = np.int8)
Print ("Le tableau masqué est: \ n", masque)
print ("\ n")
mask_na = np.mame.rempli (masque.astype (flotteur), np.nan)
print ("remplacé par nan: \ n", mask_na)

Tout d'abord, la bibliothèque Numpy est importée dans le programme pour utiliser les fonctions du tableau et de MA. Le tableau est déclaré en utilisant le NP.Fonction Array (). Ensuite, le ma.Masked_Array () est utilisé pour masquer le tableau. Ensuite, nous utilisons le NP.mame.Fonction remplie pour remplacer les valeurs non valides par des valeurs NAN. Maintenant, regardons le résultat suivant:

Exemple 2:

Puisque nous comprenons comment les fonctions Numpy sont utilisées pour masquer un ensemble de données, voyons comment utiliser les fonctions Scipy sur le tableau masqué pour effectuer les calculs selon nos exigences. Dans cet exemple, nous masquerons un tableau avec des fonctions Numpy et en utilisant une fonction Scipy avec les tableaux masqués. Considérez l'exemple de code suivant:

Importer Numpy comme NP
Importer Numpy.ma comme ma
de Scipy.Statistiques.MSTATS IMPORT DÉCRIRE
données = np.Array ([2, 5, 8, -9, -7])
masque = mA.masqued_array (données, masque = [0, 0, 0, 1, 1],
dtype = np.int8)
Print ("Le tableau masqué est: \ n", masque)
print ("\ n")
mask_na = décrire (masque)
print ("La description du tableau: \ n", mask_na)

La bibliothèque Numpy est importée dans le programme car nous devons utiliser la ma.Fonction masqued_array () pour masquer l'ensemble de données. La bibliothèque Scipy, son package de statistiques et la classe MSTATS sont importées dans le programme afin d'utiliser la fonction «décrire». La fonction «décrire» est utilisée pour obtenir la description statistique du tableau ou de l'ensemble de données spécifié. La syntaxe de la fonction décrite () est la suivante:

Le paramètre «tableau» prend les données d'entrée. Le paramètre «axe» est utilisé pour définir l'axe à utiliser pour la description. Le paramètre «DDOF» est utilisé pour trouver le degré de liberté. Et le paramètre «biais» est utilisé pour définir le biais statistique. Maintenant, voyons la sortie de la fonction décrite dans l'extrait suivant:

Exemple 3:

Utilisez une autre fonction Scipy sur le tableau masqué pour comprendre le fonctionnement de la fonction avec des tableaux masqués. Dans cet exemple, nous vous montrerons l'utilisation de la fonction de mode avec le tableau masqué. Considérez l'exemple de code suivant:

Importer Numpy comme NP
Importer Numpy.ma comme ma
de Scipy.Statistiques Import Mstats
données = np.Array ([2, 5, 8, -9, -7])
masque = mA.masqued_array (données, masque = [0, 0, 0, 1, 1],
dtype = np.int8)
Print ("Le tableau masqué est: \ n", masque)
print ("\ n")
mask_na = mstats.Mode (masque)
print ("Le mode de tableau: \ n", mask_na)

La première section du programme est la même que nous avons utilisée dans l'exemple précédent. L'ensemble de données et la méthode de masquage du tableau sont également les mêmes. Nous avons seulement changé la méthode. Ici, nous utilisons la fonction de mode pour trouver le mode du tableau masqué. La syntaxe de la fonction de mode est la suivante:

Le paramètre «tableau» est utilisé pour fournir l'ensemble de données. Le paramètre «axe» est utilisé pour définir l'axe à utiliser pour trouver le mode des données. Maintenant, voyons le mode du tableau masqué dans ce qui suit:

Exemple 4:

La fonction suivante de la bibliothèque Scipy qui peut être utilisée avec un tableau masqué est Zscore (). La fonction Zscore est utilisée pour calculer le ZSCORE des données données. Considérez l'exemple d'exemple suivant:

Importer Numpy comme NP
Importer Numpy.ma comme ma
à partir des statistiques d'importation Scipy
données = np.Array ([2, 5, 8, -9, -7])
masque = mA.masqued_array (données, masque = [0, 0, 0, 1, 1],
dtype = np.int8)
Print ("Le tableau masqué est: \ n", masque)
print ("\ n")
mask_na = statistiques.Zscore (masque)
print ("le zscore est: \ n", mask_na)

Encore une fois, nous utilisons le même programme et avons simplement changé la fonction Scipy à utiliser avec le tableau masqué. Comme vous pouvez le voir, nous passons le tableau masqué à la fonction Zscore. La syntaxe de la fonction Zscore est la suivante:

Le paramètre «tableau» est utilisé pour fournir les données à la fonction Szcore. Le paramètre «axe» maintient l'axe à utiliser pour calculer le zscore. Le paramètre «DDOF» est utilisé pour définir le degré de correction de la liberté. Enfin, le paramètre «nan_policy» est utilisé pour définir comment gérer les valeurs NAN. Maintenant, voyons le résultat suivant de la fonction Zscore:

Conclusion

Cet article Python est un aperçu rapide du tableau masqué Scipy. Nous avons appris que Scipy ne fournit aucune fonction ou méthode pour masquer un tableau. Cependant, il fournit une liste de fonctions simples et utiles qui peuvent être utilisées avec des tableaux masqués. La bibliothèque Numpy propose le ma.Fonction masquée_array () pour masquer le tableau et ce tableau masqué peut être transmis à n'importe quelle fonction Scipy pour effectuer l'opération souhaitée sur les données masquées.