pandas astype

pandas astype
L'objet Pandas est généralement jeté à un dtype spécifique.Fonction Astype () à l'aide de la méthode Astype (). Cet outil peut également modifier n'importe quelle colonne éligible en un type catégorique. Nous l'utilisons lorsque nous souhaitons convertir un type de données de colonne spécifique en un autre type de données. L'entrée du dictionnaire Python peut également être utilisée pour modifier plusieurs types de colonnes simultanément. Le nom de la colonne et les nouveaux données que nous souhaitons utiliser dans les colonnes sont représentées dans le dictionnaire par les étiquettes de la clé et des valeurs, respectivement. La technique de Pandas Astype a plusieurs applications.

Cet outil nous permet de modifier le type de données de:

  1. Une série de pandas
  2. Chaque colonne dans un Pandas Dataframe
  3. Plusieurs colonnes dans un dataframe

Comment utiliser la fonction Astype () dans Pandas

Pour utiliser la fonction Astype (), nous devons d'abord comprendre sa syntaxe. Les objets de la série et les dataframes peuvent être utilisés avec la méthode ASTYPE. La syntaxe pour Astype sur la série et Astype sur les colonnes du DataFrame sont les suivantes:

Syntaxe de la fonction Astype () en série

Tapez simplement le nom de la série suivi de la «syntaxe de points» de la fonction Astype () pour invoquer la méthode d'une série.

Syntaxe:

Syntaxe de la fonction ASTYPE () sur les colonnes DataFrame

Nous devons d'abord taper le nom de la trame de données avant d'appeler la méthode Astype () «Syntaxe de points».

Syntaxe:

Trame de données.astype (dtype, copy = true, errors = "relance", ** kwargs)

dtype: L'objet Pandas est coulé au même type en utilisant le type Python ou Numpy.dtype. Une ou plusieurs colonnes de DataFrame peuvent être jetées aux types spécifiques à la colonne. Il est également possible d'utiliser col: dtype,? En tant qu'alternative, où Col représente le nom de la colonne et DTYPE est un Numpy.

copie: Il fournit une copie si copie = true. Lorsque Copy = False, nous devons être prudents car les modifications des valeurs peuvent se propager à d'autres objets de pandas.

erreur: Si vous essayez d'appliquer un type de données incorrect ou non valide sur l'objet, la technique augmentera une exception ou non, selon la valeur du paramètre d'erreur. Les deux réponses à cela sont les suivantes:

augmenter(S'il y a un problème, il soulèvera une exception)

ignorer (S'il y a un problème, il supprimera les exceptions. il renverra l'objet d'origine s'il y a une erreur)

Dans Astype () Fonction Raison = true par défaut.

kwargs: Le constructeur reçoit un argument de mot-clé (kwargs) comme entrée.

Maintenant, nous avons vu la syntaxe. Nous enseignerons l'utilisation de la fonction astype () dans les exemples suivants.

Exemple 1: Modification du type de données de la série de pandas

Tout d'abord, nous importerons des modules Pandas, puis nous utiliserons la fonction DataFrame () pour créer l'ensemble de données, en le faisant passer un dictionnaire de noms de colonnes et certaines listes contenant les informations que nous voulons que les variables tiennent:

De plus, nous allons créer une série qui détient uniquement la variable des dépenses de DataFrame:

Pour illustrer notre dataframe, nous utiliserons la fonction print ().

Il existe quatre variables: nom, pays, ventes et dépenses. En conséquence, le DataFrame comprend des informations sur les ventes et les dépenses manuels pour certaines personnes de différents pays.

Vérifions le type de données de notre série appelée E_Variable à l'aide de DTYPE.

Cela indique que notre série e_variable a le type de données «objet». Nous allons maintenant changer le type de données de la série en int64 à l'aide de pandas astype.

Le type de données de la sortie est DType: INT64, comme vous pouvez le voir si vous faites une attention particulière au bas de la sortie. N'oubliez pas que la variable E n'a pas été modifiée directement par ce. Étant donné que la sortie d'Astype () a été imprimée dans la console, la série E_Variable a toujours le type de données de "Object". Il faudrait réaffecter la sortie au nom de variable réel avec le code suivant si nous voulions modifier directement les données:

Maintenant, le type de données de notre série est modifié en permanence.

Exemple 2: Modification du type de données de la colonne Dataframe

Nous allons maintenant opérer sur une colonne de DataFrame. La comparaison de ceci à l'exemple 1, où nous avons travaillé avec une série Pandas, sera légèrement différent. Dans ce cas, nous allons travailler avec un dataframe. Par conséquent, la syntaxe diffère un peu. Tout d'abord, nous vérifierons le type de données actuel de notre DataFrame S_DATA. Pour vérifier le type de données du DataFrame, nous utiliserons DTYPE.

Pour examiner les types de données de la sortie, nous utiliserons également le .attribut dtypes.

Vous verrez que le type de données de cette vente a été modifié à INT64 dans la sortie. Pour ce faire, nous avons utilisé la fonction Astype, passant un argument d'un dictionnaire. Le nom de la colonne apparaît sur le côté gauche du dictionnaire, et le nouveau type de données apparaît à droite. Changeons le type de données d'une autre colonne de notre DataFrame.

Le type de données de la colonne nationale a été complètement transformé en «chaîne», comme vous pouvez le voir.

Exemple 3: Modification du type de données de plusieurs colonnes dans un dataframe

Changeons maintenant le type de données d'un certain nombre de colonnes de nos données de données. Cela peut être fait d'une manière assez similaire à la façon dont nous avons changé la colonne dans l'exemple 2. Nous utiliserons un dictionnaire différent dans cet exemple.

Une fois de plus, examinons les données d'origine avec l'utilisation du .Attribut dType avant de faire l'opération:

Une fois de plus, notez que l'objet est le type de données de chaque colonne de DataFrame.

Nous allons maintenant modifier le type de données de plusieurs colonnes. Pour ce faire, nous créerons un dictionnaire avec le nom et le type de données de la variable à mesure que ses paires «clé» et «valeur». Après l'attribut Astype, nous appellerons en outre le .Attribut dtypes afin que nous puissions observer les nouveaux données.

Vous verrez que les données de trois colonnes ont changé dans la sortie. Le type de données de la colonne du pays est changé en chaîne, le type de données des ventes est changé en INT64, et le type de données des dépenses est changé en INT32.

Dans la parenthèse, nous avons ajouté un dictionnaire et invoqué la méthode Astype. Certaines paires de clés / valeur avec le format «colonne»: «DataType» se trouvait dans le dictionnaire. Les nouveaux types de données et les noms de colonne ne doivent être fournis dans un dictionnaire.

Exemple 4: Casting DataTypes de toutes les colonnes dans un dataframe

La méthode Pandas Astype () par défaut essaie de lancer chaque colonne de dataframe aux types Python (int, texte, flotteur, date et datetime) ou Numpy.dtype fourni. L'opération échoue et l'erreur «ValueError: non valide littéral» est augmentée si des colonnes ne peuvent pas être coulées en raison de données non valides ou NAN. Pour cet exemple, créons un nouveau DataFrame à partir des dictionnaires.

Tous les noms de la colonne de données et DTYPES sont renvoyés par le DataFrame.Fonction DTYPES. N'oubliez pas que chaque colonne a un type d'objet dans le dataframe indiqué ci-dessus. Maintenant, nous allons lancer le type de données à la chaîne.

Comme indiqué précédemment, le DTYPE est mis à jour pour toutes les colonnes du DF DataFrame.

Conclusion

Dans ce tutoriel, nous avons essayé de vous apprendre à utiliser le Python Pandas DataFrame.Méthode Astype (). Nous avons changé le type de données de la colonne de DataFrame en un type de données différent, puis avons examiné le DataFrame. Nous avons implémenté quelques exemples dans cet article, vous pouvez donc être en mesure de modifier le type de données de la série et le type de données de la colonne de trame de données à l'aide de la méthode Pandas Astype dans Python.