Pandas convertir toutes les colonnes en chaîne

Pandas convertir toutes les colonnes en chaîne
Pandas, un progiciel Python, propose un traitement et une évaluation des données. Il aborde facilement les données manquantes et est rapide, adaptable et clair. La structure de données robuste offre non seulement mais améliore également la fonctionnalité des outils pour la modification et l'analyse des données.

Un type de données est un bloc de construction fondamental utilisé par les langages de l'ordinateur pour comprendre comment préserver et modifier les données. Dans un Pandas DataFrame, vous pouvez souvent transformer les colonnes uniques ou multiples en chaînes. Commodément, en utilisant les différentes fonctions natives des pandas, c'est simple à accomplir.

Cet article vous apprendra à transformer les valeurs dans une colonne en un type de données de chaîne à l'aide de la bibliothèque Pandas à Python. Vous découvrirez alors comment transformer les flotteurs et les entiers en cordes de pandas. Vous découvrirez comment convertir les colonnes dans un Pandas DataFrame en une chaîne en plus des quatre façons distinctes de le faire. Le dataframe.astype (str), dataframe.valeurs.astype (str), dataframe.Appliquer (str), dataframe.map (str) et dataframe.applicablemap (str) sont quelques-unes des méthodes utilisées dans la démonstration pour convertir tout type en type de chaîne.

Construire des données de données à l'aide de pandas.Méthode DataFrame ()

La première et la première exigence pour le programme consiste à importer la bibliothèque Pandas en tant que PD pour profiter des fonctionnalités Pandas. L'étape suivante consiste à créer un Pandas DataFrame. Nous allons construire un dataframe avec trois colonnes distinctes, l'une d'entre elles s'exécute en tant que chaîne et les deux autres se chargeront en entiers. Ensuite, nous utilisons la fonction print () pour afficher ses cinq enregistrements.

Dans l'illustration précédente, nous avons créé un dataframe qui utilise les pandas.Méthode DataFrame (). Ce dataframe a trois colonnes: «nom», «âge» et «salaire». Chaque colonne stocke cinq enregistrements ou valeurs. Nous avons créé un objet DataFrame «Données» et l'avons attribuée la sortie de l'appel PD.Méthode DataFrame (). Ainsi, le Pandas DataFrame est accessible en utilisant cet objet. Nous avons ensuite utilisé la fonction print () pour afficher le dataframe.

Le DataFrame que nous venons de créer apparaît sur le terminal qui peut être vu dans l'instantané attaché dans les éléments suivants:

Maintenant, nous découvrons les données de toutes les colonnes du dataframe. Pour cela, nous utilisons les pandas .fonction info (). Le .La méthode info () nous affiche les détails sur le dataframe, fournissant les données de données pour chaque colonne, nous permettant d'examiner comment les pandas traitent les données de chaîne.

Nous avons utilisé le Pandas DataFrame.Méthode info () dans le code précédent. La fonction print () est ensuite invoquée avec les données.info () comme paramètres pour afficher les informations sur le type de données des colonnes de DataFrame.

Ceci est la sortie affichée sur le terminal:

Dans l'exemple précédent, nous pouvons observer que les pandas gèrent toujours les cordes en tant qu'objets par défaut. Les chaînes et les types de données mixtes sont tous deux gérés par le type de données de l'objet. Cependant, ce n'est pas particulièrement évident.

Les pandas ont un type de données de chaîne spécifique à partir de la version 1.0. Bien que ce type de données ne fournisse pas encore aucune amélioration claire de stockage ou d'efficacité, l'équipe de développeur Pandas a déclaré que cela se produirait à l'avenir. En conséquence, la leçon utilise exclusivement le type de données de chaîne.

Commençons par convertir une colonne en une chaîne en utilisant l'approche Pandas préférée.

Exemple 1:

La première méthode que nous utilisons est la fonction Pandas Astype (). La technique de la colonne (série) est une caractéristique de Pandas.

Si vous utilisez les pandas 1.0 ou version ultérieure, passez dans la "chaîne". Sinon, utilisez le «Str» pour les éditions de Pandas avant 1.0. En adoptant cela, vous pouvez être certain que le type de données de chaîne est utilisé à la place du type de données d'objet.

Commençons par sa démonstration pratique dans un environnement python.

Dans le code précédent à l'aide des «données» de DataFrame précédemment créées, nous avons maintenant utilisé les pandas «.Fonction Astype () ». Nous avons écrit le nom de DataFrame avec le «.Fonction Astype () »et a fourni le type de données« String »comme paramètre. Par la suite, nous avons invoqué le «.Méthode info () ”dans les parenthèses de la fonction print () pour afficher le type de données mis à jour des colonnes DataFrame.

L'exécution du script Python précédent nous donne le résultat suivant:

La colonne «Age» de notre Pandas DataFrame, qui a été initialement conservée en tant qu'int64, est actuellement gérée comme un type de données de chaîne que cela peut être vu.

Exemple 2:

Vous pouvez utiliser le .Technique map () pour modifier une colonne de pandas en chaînes d'une manière identique à la .Fonction de la série Astype () Pandas.

Explorons ce que cela semble être:

L'illustration commence par utiliser le code du dataframe que nous avons expliqué dans l'exemple précédent. Après avoir imprimé le DataFrame, nous avons ensuite affiché les données à l'aide du «.fonction info () ”. Maintenant, nous choisissons une colonne dont le type de données est converti pour se convertir en chaîne. Nous avons à nouveau sélectionné la colonne «Age» dans ledit but. Ensuite, nous avons invoqué le «.Fonction Map () ”avec l'objet DataFrame et le nom de la colonne spécifiée. Nous avons également défini le type de données dans le «.Carte (STR) ”Braces de la fonction. Nous devons vérifier le type de données mis à jour avec le «.méthode info () ”.

La sortie peut être vue dans l'image suivante:

Il ressort clairement que le type de données de chaîne ne peut pas être utilisé lors de l'utilisation du .Méthode map (). Les données sont stockées dans le type de données d'objet en conséquence. Pour cette raison, si vous exécutez une édition supérieure à 1.0, nous vous conseillons de ne pas utiliser cette méthode.

Exemple 3:

Comme la technique décrite précédemment, nous pouvons également modifier le type de données d'une colonne Pandas en chaînes en utilisant le .Méthode appliquer (). Les mêmes restrictions s'appliquent, en ce que nous ne pouvons les transformer que en données d'objets. Nous ne pouvons toujours pas les transformer en dataTypes de chaîne.

Jetons un coup d'œil:

Comme vous pouvez le voir dans le script précédent fourni, la méthode applique () est utilisée. Entre les accolades de cette fonction, nous spécifions le type de données. Cette méthode ne prend pas la «chaîne». Au lieu de cela, cela fonctionne avec «Str». Ensuite, nous avons affiché les données avec l'utilisation de la méthode info ().

Le terminal résultant montre que le type de données mis à jour est passé de INT64 à l'objet qui est une chaîne.

Exemple 4:

De plus, nous pouvons utiliser la valeur des pandas.Fonction Astype () pour transformer directement les valeurs d'une colonne en chaînes.

Ici, nous explorons ses œuvres avec l'implémentation du code Python:

Avec le même DataFrame et la même colonne, nous avons utilisé les «valeurs Pandas«.Astype () »Méthode et a passé le type de données« str »comme argument. Enfin, nous avons affiché les datatypes avec la méthode info ().

Cela nous donne la sortie suivante:

Exemple 5:

Notre dernier segment vous apprend à utiliser le .Fonction appliquée applicable () pour transformer toutes les colonnes Pandas DataFrame en chaînes.

Dans cette méthode, nous avons utilisé le .Méthode appliquée en applicationmap (). Comme nous voulons convertir toutes les colonnes, nous n'avons besoin de mentionner aucun nom de colonne spécifique avec l'objet DataFrame comme nous l'avons fait plus tôt. Nous avons simplement utilisé l'objet DataFrame avec le .Fonction appliquée () APPLICATION et a passé le type de données «Str» en tant que paramètre.

C'est la sortie suivante:

Conclusion

Cette leçon est basée sur les différentes méthodes des Pandas pour convertir les colonnes en données de chaîne. Nous avons utilisé toutes les façons possibles de vous donner un tas de choix faciles lorsque nous rencontrons de tels problèmes. Nous avons démontré quelques exemples de codes pratiques pour vous aider à apprendre les différentes techniques de pandas. Nous espérons que cette écriture vous aidera à comprendre les modules Pandas.