Pandas à la chaîne

Pandas à la chaîne
«Les approches DataFrame et Series que les Pandas nous proposent peuvent être utilisées pour chaque colonne de votre DataFrame et sont conçues pour fonctionner avec des chaînes. En utilisant la méthode «ApplyMap (STR)», nous pouvons changer le dataframe en chaînes, comme vous pouvez le voir dans l'échantillon ci-dessous. Cette méthode convertira facilement un type de données en un type de chaîne. Dans Pandas, nous avons principalement utilisé «objet» comme type de données pour la chaîne. Nous pouvons déterminer le nombre total de caractères inclus dans les valeurs de la colonne en utilisant la technique «longueur ()» dans le traitement des chaînes."

La syntaxe pour convertir DataFrame en chaîne

La syntaxe pour obtenir la longueur des valeurs de chaîne présente dans une colonne

Exemple 1: Convertir le DataFrame en chaînes en utilisant ApplyMap (STR)

Dans Python, il existe de nombreuses méthodes construites pour travailler avec des chaînes. Chacune de ces méthodes renvoie une nouvelle valeur sans modifier la chaîne d'origine. Pour les valeurs de chaîne, le type de données «objet» est utilisé. Dans Python Pandas, le type de données de texte est appelé «chaîne» ou «objet». Une chaîne peut inclure une phrase de mot ou peut également être un nombre. Dans ce cas, nous utiliserons «ApplyMap (Str)» pour transformer un DataFrame entier en un type de chaîne. Le «Appliquer (Str)» est utilisé pour convertir les entiers en chaînes, et l'application APPLICATION (STR) est utilisée pour convertir la Full DataFrame en chaînes.

Parlons maintenant de l'exécution de notre code. Pour exécuter notre code, nous avons utilisé l'outil «Spyder». La bibliothèque Pandas doit être importée d'abord sous forme de «PD». Nous construisions ensuite notre dataframe. Le dataframe est nommé «données». Nous avons trois colonnes dans ce Dataframe «Course», «Fee» et «Credit Hour». Ces colonnes ont désormais certaines valeurs qui leur sont attribuées. Nous avons une liste de cours "Python", "OOP", "Virtual_ Studio" et "Java" dans la colonne "Course". Les valeurs de la colonne «Frais» Nous avons «35000», «30000», «20000» et «15000» et dans la dernière colonne «Credit_Hour», nous avons «3», «4», «3» et « 3 ”. Par conséquent, le «PD.DataFrame »est utilisé pour créer le cadre de données. Dans cette illustration, nous affichons également les «types de données» de notre programme en utilisant la fonction «print ()» avec «DF. Types de données". Essentiellement, «DF.DataTypes »est utilisé pour créer un type de données pour un dataframe.

Nous passons maintenant à l'objectif principal de notre programme. Pour convertir le DataFrame en une chaîne, nous utilisons «DF.appliquer map (str) ". À l'aide de la méthode «applicablemap ()», une fonction peut être appliquée deux fois à n'importe quel élément de dataframe. Dans Pandas, le «Str» est principalement utilisé pour récupérer les valeurs de Dataframes ou Series. Ce qui se passe dans ce programme, c'est que cette fonction convertit les types de données de «entier» aux types de données «chaîne». Invoquant la fonction «print ()», nous affichons maintenant notre DataFrame et ses types de données après avoir utilisé le «APPLICATIONMAP (STR)».

Deux données de données avec les types de données seront affichées dans l'image de sortie de notre programme. Nous pouvons voir dans le deuxième DataFrame qu'il a converti le DataFrame en une chaîne en modifiant le type de données. Les types de données entiers sont maintenant affichés sous forme de types de données «objet». Pour la chaîne, nous utilisons «objet» comme type de données. Ce type de données de chaîne «d'objet» lui permet d'être une seule valeur, un numéro ou une phrase. Dans le premier DataFrame, les types de données pour les colonnes «Frais» et «Credit_Hour» étaient des entiers; Cependant, après avoir été converti en chaînes, les types de données pour ces colonnes sont affichés sous forme de «objets». Enfin, il affiche «Dtype: objet», indiquant qu'il a été converti en une chaîne.

Exemple 2: Conversion des valeurs de colonne en type de chaîne en utilisant la fonction «Astype ()»

Dans cet exemple, un type de données d'une seule colonne sera converti en un type de «chaîne». Dans l'exemple précédent, l'intégralité de DataFrame a été convertie en chaînes, tandis que dans ce cas, une seule colonne est convertie en chaînes. Nous avons converti la colonne en type de chaîne à l'aide de la fonction «Astype ()». La fonction «Astype ()» dans les pandas est principalement utilisée lorsque nous souhaitons transformer un type de données en un autre type de données; Cependant, il existe d'autres méthodes alternatives en Python pour modifier simultanément un ou plusieurs types de données.

Maintenant, commencez le codage. La bibliothèque Pandas doit d'abord être importée comme un «PD."L'étape suivante consiste à créer le DataFrame avec le même nom que les« données »de l'étape précédente. Ce DataFrame a quatre colonnes «cours», «frais», «durée» et «remise». Pour chacune de ces colonnes, nous avons énuméré certaines valeurs. Les valeurs de la première colonne sont les suivantes «Java», «Graphic_desing», «Android_studio» et «OOP». Dans la deuxième colonne, «Charges», nous avons «20000», «21000», «20000» et «24000». Nous avons les valeurs «1_month», «2_month» et «3_month» dans la troisième colonne, «durée» et dans l'entrée finale, nous avons les remises «20%» et «30%» pour les cours. Le DataFrame est ensuite généré à l'aide de «PD.trame de données". Le DataFrame sera désormais affiché à l'écran à l'aide de la fonction «print ()», et ses types de données seront également imprimés à l'aide du «DF.Commande DTYPES ».

Nous allons maintenant utiliser la fonction «Astypes ()» pour convertir la colonne particulière en une chaîne. Avec «Astype ()» et le nom de la colonne des paramètres «charge» et le type de données «chaîne» à l'intérieur, nous convertissons la colonne «charge» en une chaîne dans ce cas. Maintenant, nous appliquerons la fonction «print ()» pour afficher les résultats à l'écran.

Comme nous pouvons le voir, le type de données de la colonne «Charge» dans le premier cas est «int64», ce qui signifie que les valeurs de la colonne sont des entiers, mais lorsque la colonne a été convertie en une chaîne, une «chaîne» a été affichée dans avant de la «charge» comme type de données. Le type de données pour une chaîne dans Python est un «objet» et comme les trois colonnes restantes sont des chaînes, cela indique que maintenant l'ensemble de la dataframe sera transformé en chaînes.

Exemple 3: Déterminer la longueur de la chaîne pour une certaine colonne dans un dataframe

Dans cet exemple, nous déterminerons la longueur de chaque valeur de chaîne pour une certaine colonne dans le dataframe. À l'aide de la fonction «longueur ()», nous pouvons déterminer la longueur des valeurs de chaîne. Cette méthode est utilisée pour déterminer les caractères totaux dans une chaîne d'entrée.

Après avoir importé la bibliothèque Pandas pour commencer le troisième exemple de notre article, nous devons construire un dataframe avec trois colonnes, similaires à l'exemple précédent, en utilisant «PD.trame de données". «Student_name», «roll_number» et «total_marks» sont disponibles en colonnes. Ces colonnes sont répertoriées avec certaines valeurs. «Albert», «Jhon», «Ava», «Oliver» et «Amelia» sont répertoriés dans la première colonne, tandis que leurs numéros de rôle sont répertoriés dans la deuxième colonne comme «1», «2», «3», « 4 ”et« 5 ». Et dans la colonne finale, nous fournissons leurs dernières notes «498», «470», «444», «390» et «489», respectivement. Maintenant que l'instruction «DataFrame» a été imprimée, nous utiliserons la fonction «print ()» pour afficher le dataframe en dessous.

Suite à cela, nous affichons une ligne d'instruction qui dit: «Calculant la longueur de la chaîne dans une colonne», et nous calculons cela en utilisant la fonction «Longueur ()». Nous pouvons observer à partir de notre dataframe que la colonne «Student_name» contient des valeurs de chaîne afin que nous puissions déterminer la longueur de ses valeurs. Nous utilisons cette colonne. Par conséquent, nous utilisons «df [nom d'élève]» avec «postuler (len)». Cela ajoutera les nombres totaux de chacune des valeurs de cette colonne, qui seront ensuite affichées en tant que nouvelle colonne dans le DataFrame avec le nom "Student_Name_Length". Passons à ses résultats actuellement.

Deux dataframes sont affichés ici, comme vous pouvez le voir. Le deuxième DataFrame a une colonne supplémentaire, «Student_Name_Length», et comme nous pouvons le voir, il calculera le nombre total de mots et l'affichera là-bas. Par exemple, le nom «Albert» a un total de 6 caractères. Cela indique que cette fonction fonctionne avec succès dans notre programme.

Conclusion

Les pandas offrent diverses méthodes pour transformer un dataframe en une chaîne. L'ensemble des données peut être converti en une chaîne à l'aide de «ApplyMap (str)», qui transformera l'entier de type de données en chaîne. Le calcul des caractères des valeurs de chaîne dans une colonne à l'aide de la méthode «longueur ()» est également très utile. Si nous souhaitons calculer plusieurs valeurs uniques, cette technique de pandas nous simplifiera. Il sera plus simple pour nous de travailler si nous appliquons de petites stratégies simples et simples. Nous prévoyons que si nous utilisons ces stratégies efficacement, notre travail sera beaucoup trop simple.