Pandas modifie le type de colonne en chaîne

Pandas modifie le type de colonne en chaîne
Les types de colonnes d'un DataFrame peuvent devoir être modifiés après la création pour diverses raisons, par exemple pour convertir une colonne en un format numérique qui peut être utilisé pour la modélisation et la classification. Ce tutoriel vous montre comment convertir les valeurs de la colonne en un type de données de chaîne à l'aide du package Pandas de Python. Nous essaierons de vous apprendre à changer les valeurs flottantes et entiers des pandas en cordes. De plus, vous apprendrez les avantages de l'utilisation du type de données de chaîne dans Pandas ainsi que la façon dont les chaînes ont évolué en pandas. Nous utiliserons différentes fonctions pour modifier les dataypes de la colonne DataFrame en une chaîne.

String DataType de Pandas

Les pandas utilisent le type de données d'objet par défaut pour stocker les chaînes. Les chaînes et les types de données mixtes sont tous deux gérés par le type de données de l'objet, cependant, il n'est pas explicite particulièrement. Il y a eu un type de données dédié de String dans Pandas dans la version 1.0. Bien que ce type de données ne fournisse pas encore aucune amélioration des ressources ou des performances explicites, l'équipe de développement de Pandas a déclaré que cela se produirait à l'avenir. En conséquence, ce tutoriel utilise exclusivement le type de données de chaîne. Utilisez le «str» à la place de la chaîne chaque fois que possible si vous utilisez une version python inférieure à 1.0.

Comment changer la colonne Pandas en chaîne

Différentes fonctions peuvent être utilisées pour modifier la colonne en pandas en un type de données de chaîne. L'utilisation de la méthode Astype () est le moyen le plus courant de le faire. Jetons un coup d'œil à la fonction Astype () pour voir comment cela fonctionne.

Syntaxe: DF.astype ("Column_name": str, errors = "relance")

df.Astype (): Une méthode pour appeler la fonction Pandas Astype.

«Nom de la colonne»: Str: Les colonnes à convertir en un format différent (type de données de chaîne). Le nom de la colonne est la colonne dont le type de données va être modifié. Les valeurs de colonne doivent être transformées en type de données requis, qui est la chaîne. Tout type de données intégré de Python ou de DataType est acceptable.

errors = 'relance': Pour définir comment les exceptions doivent être gérées pendant la convertion. Seules les valeurs possibles des cellules sont converties; «River» affichera une erreur, et «ignorer» l'ignorera.

Nous avons vu la syntaxe de la méthode Astype (). Maintenant, dans les exemples suivants, vous apprendrez à utiliser les fonctions Astype (), d'autres fonctions et les attributs pour convertir les colonnes DataFrame en chaînes.

Exemple 1: Utilisation de la méthode Astype ()

Un objet Pandas peut être converti en un type de données spécifique à l'aide de la méthode ASTYPE (). Toute colonne existante appropriée peut être convertie en un type catégorique à l'aide de la fonction ASTYPE (). Lorsque nous devons convertir le type de données d'une colonne spécifique en un autre type de données, la méthode Astype () est très utile. Dans cet exemple, nous allons modifier le type de données de colonne en chaîne à l'aide de la fonction ASTYPE () car nous devons créer un dataframe. Pour créer un dataframe, nous importerons d'abord la bibliothèque Pandas pour utiliser ses fonctionnalités et fonctionnalités.


Nous avons créé notre DataFrame en transmettant un dictionnaire au PD.DataFrame () fonctionne comme un argument. Les clés du dictionnaire deviennent les étiquettes de chaque colonne après les avoir passées dans le PD.La fonction DataFrame () et les valeurs des clés deviennent les valeurs des colonnes de DataFrame. Pour visualiser le dataframe, nous utilisons la fonction print ().


Dans le DataFrame précédent, nous avons quatre colonnes DataFrame. La première colonne «étudiante» contient les noms des étudiants - «Jack», «Tony», «Marty», «Alex», «Rob». Dans la deuxième colonne «Age», l'âge de chaque élève est stocké «16, 15, 18, 17, 17». Tandis que la colonne «frais» stocke les frais de chaque cours «7000.0, 6500.0, 7100.0, 7000.0, 6900.0 ”. Le sujet de la colonne se compose des noms des matières - «anglais», «statistiques», «mathématiques», «anglais», «science» . Nous pouvons vérifier le type de données de chaque ligne en utilisant l'attribut dTypes comme suit:


Le type de données des colonnes «étudiant» et «sujet» est «objet».Tandis que le type de données des colonnes «Âge» et «Fee» est respectivement INT64 et Float64. Maintenant, changeons le type de données de la colonne «Frais» de Float en chaîne.


Au fur et à mesure que nous appliquons la méthode ASTYPES () et passé le type de données «chaîne» pour modifier le type de données de la colonne «frais», voyons si la colonne est convertie en une chaîne ou non.


Vous pouvez remarquer que le type de données de la colonne «Frais» est converti en chaîne à partir de float64.

Exemple 2: Utilisation de la méthode map () et appliquer ()

La méthode map () est utilisée pour convertir les valeurs de la série en leurs entrées correspondantes. Pour modifier chaque valeur de données dans une série avec une valeur différente, la fonction map () est utilisée. Cette valeur peut être obtenue à partir d'une série, d'un dict. Cependant, ces fonctions peuvent être utilisées pour modifier le type de données des colonnes. Utilisons le même dataframe que nous avons créé dans l'exemple précédent.


Maintenant, nous vérifions les données des colonnes à l'aide de l'attribut dTypes.


Maintenant, modifions les données de la colonne «Age» à l'aide de la fonction map () et modifiez les données de la colonne «frais» avec la fonction applique ().


Nous avons appliqué à la fois la fonction map () et appliquer () à la colonne «frais» et «âge», respectivement. Utilisons l'attribut DTypes sur notre DataFrame «DF» pour voir les résultats.


Ici, nous pouvons voir que le type de données «String» ne peut pas être utilisé lors de l'utilisation de la méthode map () et appliquer (). Les deux colonnes «âge» et «frais» sont désormais converties en type de données d'objet en conséquence. Cependant, les pandas utilisent le type de données d'objet par défaut pour stocker les «chaînes», mais nous voulons le résultat dans le type de données «String». Pour cette raison, nous ne vous conseillons pas d'utiliser ces méthodes dans les nouvelles versions de Python pour modifier les données des colonnes.

Exemple 3: Utilisation de la méthode Astype ()

Dernier point mais non le moindre, nous utilisons la méthode Astype () pour modifier le type de données du DataFrame en chaînes. Nous avons vu comment changer les données de données de colonnes spécifiques du dataframe en «chaîne» dans les exemples précédents. Maintenant, nous modifions les données de toutes les colonnes en «chaîne» dans cet exemple. Encore une fois, nous utilisons le Dataframe «DF» pour cet exemple.


En utilisant l'attribut DTypes, vérifions d'abord les données de nos colonnes de données de données «DF».


Aucune des colonnes du DataFrame précédent n'a une colonne avec un type de données de chaîne. Maintenant, nous utilisons la méthode ASTYPE () pour modifier le type de données de toutes les colonnes du DataFrame en «chaîne» du type de données.


Comme on peut le voir, en utilisant simplement la propriété ASTYPE () avec le DataFrame lors du passage de la «chaîne» à l'intérieur de la fonction, vous pouvez facilement modifier toutes les colonnes du DataFrame en chaîne.


Les données de chaque colonne sont changées en chaîne.

Nous pouvons également utiliser la fonction applicablemap () ou le .valeurs.Astype () pour convertir les dataTypes, mais ils renverront le type de données «objet» au lieu de «String».

Conclusion

Dans ce tutoriel, nous avons discuté de ce qu'est une chaîne de type de données dans Python et comment vous pouvez changer la colonne Pandas en chaîne. Nous avons appris la syntaxe de la fonction Astype () pour comprendre comment elle fonctionne. Après avoir parcouru ce tutoriel, vous pourrez peut-être changer les colonnes dans la chaîne par vous-même. Nous avons mis en œuvre différents exemples pour vous apprendre comment la méthode ASTYPE MAP () et appliquer () peuvent être utilisées pour modifier les colonnes Pandas en chaîne de données.