Colonnes Pandas Split par délimiteur

Colonnes Pandas Split par délimiteur
«Pandas» est un package Python. Il est flexible et a une conception expressive structurée des données sur laquelle travailler avec des données de différentes manières. De plus, Panda DataFrames est idéal pour manipuler les données. La plupart du temps, nous travaillons sur des données qui ont une colonne contenant une valeur de chaîne délimitée, par exemple, «x, y, z» et nous voulons qu'ils soient dans des colonnes distinctes. Ceci est possible en utilisant une fonction des pandas dont nous discuterons dans cet article. Nous apprendrons à diviser une colonne de texte en colonnes distinctes individuellement. Pour cette fonction Pandas de la colonne divisée par délimiteur doit être utilisée. Sa syntaxe est un peu comme la fonction Python String «Str ()». Mais les pandas divisés par colonne, divisent les données de l'ensemble des données. Pour l'implémentation du code, nous utiliserons l'outil «Spyder». Comme c'est le logiciel Python Language-Friendly.

Syntaxe

Str.diviser()

La syntaxe ci-dessus est utilisée pour diviser le texte en colonnes dans un dataframe. Il fonctionne en divisant la colonne par délimiteur en différentes colonnes. Nous implémentons la syntaxe de la série Pandas «Str.Split () ”Fonction sur la colonne« Adresse »et passez-la avec la« virgule »pour la séparation de la colonne que nous voulons diviser.

Paramètres

Il y a certains paramètres que nous utiliserons plus tard dans les exemples de la colonne Panda Split par Demiter:

Développer: Il étend la valeur de chaîne dans une colonne distincte.

Conditions: si «true», renvoie la trame de données; Si «false», renvoie la série / index (chaînes).

«N» limite le nombre d'une division dans la sortie.

Voici les façons dont les pandas divisés par délimiteur peuvent être effectués:

  • Colonne Pandas Split par Delimiter (Ajoutez une nouvelle colonne au «DF»).
  • Colonne Pandas Split par Demiter (à l'intérieur d'une liste).
  • colonne Pandas Split par délimiteur spécifiant le nombre de fentes.

Création du dataframe pour les exemples Implémentation de la colonne Pandas Split par Delimiter

Après avoir ouvert l'outil «Spyder», importez la bibliothèque Pandas comme «PD». Maintenant, commencez à créer le «DF». Le «DF» est l'abréviation du «DataFrame». Le «DF» a l'adresse complète de certaines régions des différents pays tels que: «5632 Main Street, Park, Canada»; «2525 Downtown, Salt Mine, Italie»; «7896 Sky View, appartement, Mexique»; et le «3988» Sunshine Road, Villa, Japon ». Ici, nous voyons que les données sont séparées par colonne. Dans les exemples suivants, nous apprendrons à diviser séparément ces zones de «virgule» en colonnes en utilisant les pandas divisés par la fonction de délimiteur.

La sortie montre la création de données de données des données fournies dans le code.

Exemple 01: colonne Pandas Split par délimiteur en plusieurs colonnes

Dans cet exemple, nous allons diviser les colonnes de données de texte en plusieurs colonnes par délimiteur de la fonction Pandas Split. Le DataFrame se compose des adresses des rues comme: «5623 Main Street, centre commercial, Turquie»; «4585 Downtown, école, France»; «0032 Sky View, College, Indonésie»; et «1125 Sunshine Next, Université, Chine». Toutes ces adresses sont des zones différentes, nous séparerons ces zones de «virgule» de texte en une colonne distincte. Nous pouvons dire que nous pouvons le prendre en tant qu'opérateur de reconnaissance du séparateur pour diviser. Nous appliquerons la fonction de partage de Pandas sur «l'adresse». Ensuite, la virgule dans ce cas se séparera. De plus, nous devons nous assurer de passer les paramètres comme «développer» pour la «vraie» valeur.

La sortie affiche les colonnes distinctes de l'adresse dans la colonne «0». Dans la colonne «1», nous avons les zones en particulier et dans la colonne «2», nous avons les noms de pays. Un dataframe de données bien présenté et organisé est créé.

Exemple 02: colonne Pandas Split par délimiteur dans une liste

Nous allons créer un dataframe pour l'exemple de l'implémentation de la colonne Pandas Split par Delimiter cette fois «à l'intérieur d'une liste». Le DataFrame est comme «7854 Main Street, Tire Shop»; «8009 Downtown, Sweet Shop, Tokyo»; «1003 Sky View, Ice Cream Shop, Sri Lanka»; et «7009 Sunshine Next, lycée, Afrique». Maintenant, nous ne passerons pas le paramètre vrai dans cet exemple pour faire la division à l'intérieur de la colonne.

Ici, dans la sortie, le fractionnement est effectué à l'intérieur des colonnes. Mais cela ne s'est pas avéré afficher la création de colonnes séparées car la scission se trouve à l'intérieur d'une liste. Si nous voulons se séparer en une colonne distincte, le dernier exemple affichera.

Exemple 03: Colonne Pandas Split par Delimiter (Ajoutez une nouvelle colonne au «DF»)

Dans cet exemple, nous ajouterons une autre colonne au DataFrame à côté des colonnes distinctes qui peuvent être effectuées facilement par colonne Pandas Split et par fonction de délimiteur. Le DataFrame est le même que le dernier exemple. Maintenant, nous avons sélectionné «l'état» comme colonne complémentaire. Nous avons l'intégralité de DataFrame et encore une autre colonne dans une colonne séparée. De cette façon, si nous voulons changer ou effectuer une analyse de cette quantité spécifique de données, nous pouvons l'avoir séparément sans affecter les données d'origine.

L'affichage a séparé les colonnes et ajoute la colonne de «l'état» dans une colonne séparée de lui-même. Il s'agit de quatre colonnes par quatre, ce qui signifie 2 lignes et 2 colonnes.

Exemple 04: Colonne Pandas Split par délimiteur spécifiant le nombre de fentes

Dans l'exemple 01 ci-dessus, nous avons effectué le fractionnement des colonnes de texte en fournissant l'adresse sur l'occurrence du délimiteur «virgule», ce qui a entraîné la séparation de trois colonnes. De même, nous pouvons spécifier le nombre de divisions que nous voulons. Dans ce cas, nous apprendrons à faire cela. Le DataFrame se compose des adresses comme: «4585 12e Street, épicerie, New York »,« 7000 Portlands, aéroport, Italie »; «4555 13e Rue, gare, Espagne »; et le «7777 Commercial Next, Candy Shop, Australie». Le «n = 1» indique que nous voulons diviser la dataframe une fois. La scission se produira lors de la première occurrence, les autres colonnes gauche seront vues ensemble.

La sortie affiche le fractionnement de DataFrame en utilisant la colonne Split Pandas By Delimiter et en désignant N comme «1». Donc, le fractionnement est effectué une seule fois. Les villes et les états sont dans la deuxième colonne et la première occurrence des adresses se trouve dans la première colonne.

Conclusion

La colonne divisée de la fonction Pandas par le délimiteur est utile et efficace. Autant de fois selon le besoin, nous voulons avoir les données dans une colonne ou une convention spécifique par le besoin. Ainsi, tout cela peut être fait en utilisant la colonne Pandas Split par Demiter. Nous avons rempli des fonctions telles que plusieurs colonnes, se séparant à l'intérieur de la colonne, divisant et ajoutant une nouvelle colonne, et enfin se séparant en spécifiant le nombre de fentes.