Pandas Str contient

Pandas Str contient
«Cet article vous apprendra comment Python peut être utilisé pour déterminer si une partie particulière de la chaîne est incluse dans la valeur de la chaîne ou non. Python propose une variété de méthodes pour trouver une sous-chaîne au sein d'une chaîne, comme la vérification des modèles, l'insensibilité aux cas, et plus. Tout niveau de programmeur devrait être en mesure de gérer les chaînes à Python."

Après avoir terminé ce tutoriel, vous saurez:

  • Méthodes et opérateurs Python pour déterminer si une chaîne comprend une sous-chaîne ou non.
  • Filtrage de DataFrame lorsqu'une sous-chaîne est présente dans une colonne
  • En utilisant Regex, déterminez si une chaîne comprend un sous-chaîne de motif.

Comment trouver si une sous-chaîne ou une expression existe dans la valeur de la chaîne en pandas?

Pour déterminer si une chaîne se compose d'une sous-chaîne particulière ou non, il existe plusieurs fonctions que nous pouvons faire pour le faire.

Exemple n ° 1: Vérifiez si la sous-chaîne spécifiée est incluse dans les données de chaîne à l'aide de l'opérateur in

Dans Python, l'opérateur in peut être utilisé avec des types itérables comme les listes et les chaînes. Il est utilisé pour déterminer si un élément est présent dans l'IITARable ou non. Un élément trouvé est indiqué par l'opérateur en rendement vrai. Sinon, il renvoie faux. L'opérateur in est l'approche la plus rapide et la plus pythonique pour déterminer si une chaîne comprend une sous-chaîne en python. L'opérateur est clair à chaque lecteur de votre code ce que vous essayez d'accomplir.


La série Pandas a été créée à l'aide du PD.Fonction série () Après l'importation du module Pandas. Notre série se compose de valeurs de cordes «plancher», «notre», «annuler», «bien sûr», «tour», «magasin», «alésage» et «mal». Nous allons maintenant utiliser l'opérateur in pour constater si la sous-chaîne spécifiée existe dans les valeurs de chaîne de la série Pandas ou non. Pour itérer sur chaque valeur de la série Pandas, la boucle «pour» sera utilisée, comme on le voit dans le script ci-dessous.

En utilisant l'opérateur in, nous avons obtenu les résultats sous la forme de vrai et de faux. «True» indique la présence d'une sous-chaîne pour les valeurs de chaîne, et «FALSE» indique l'absence d'une sous-chaîne. Nous pouvons également utiliser l'opérateur In avec la liste Pandas et les colonnes DataFrame contenant des valeurs de chaîne. Essayons l'opérateur in sur une colonne de DataFrame. Pour créer le DataFrame, nous utiliserons le Pandas PD.Fonction DataFrame ().

Tout d'abord, nous avons créé un dictionnaire Python «dic» composé de paires de valeurs clés. Ensuite, nous avons passé le dictionnaire «dic» à l'intérieur du PD.Trame de données(). Nous avons créé notre DataFrame avec trois colonnes, je.e., id, nom et cours. Nous visons à découvrir si les sous-chaînes existent ou non dans la colonne de chaîne, nous ne nous concentrerons donc que sur les colonnes de chaîne. Il y a deux colonnes de cordes dans notre «nom» et «colonne» de données de données ayant les valeurs de chaîne («Davidson», «Hendery», «Henderson», «Jason», «Kim», «Jenson», «Jackson», «Carl» ») Et (« Python »,« Amazon »,« Economics »,« Business »,« Languages ​​»,« Database »,« Designing »,« Drawing ») respectivement.

Nous avons spécifié le «nom» de la colonne, qui est itéré par Loop pour vérifier si le «fils» de la sous-chaîne est présent dans les valeurs de chaîne du nom de la colonne ou non. La fonction génère le résultat en vérifiant chaque valeur à l'intérieur de la colonne.

Exemple n ° 2: filtrez une chaîne si la sous-chaîne est présente

L'opérateur in sera utilisé pour filtrer la liste, les séries ou les données de données en extraction des valeurs de chaîne si la sous-chaîne est présente. Pour ce faire, nous allons parcourir chaque élément de l'objet en utilisant un itérateur pour Loop pour voir si une sous-chaîne est présente. Si les éléments de la liste sont constitués de la sous-chaîne, les chaînes seront ajoutées à une autre liste. Laissez d'abord créer un objet de liste

Tout d'abord, nous avons créé une liste contenant les éléments comme valeurs de chaîne «banane», «pomme», «nature», «analyser», «poisson», «nom», «chemise», «analogique». Ensuite, une liste vide «filtrée» est créée pour stocker les valeurs résultantes. Nous avons utilisé l'opérateur in pour déterminer la présence des sous-chaînes. La fonction d'ajout est utilisée pour ajouter les chaînes de sortie (où la sous-chaîne était présente) dans la chaîne vide «filtrée». Nous avons quatre valeurs, je.e., «Banane», «analyser», «nom», «analogique» qui contiennent la sous-chaîne «na». Maintenant, laissez-le essayer avec une colonne DataFrame. Nous utiliserons le DataFrame que nous avons créé dans l'exemple # 1.

Cette fois, nous vérifierons la colonne de cours.

Nous avons spécifié que la colonne de cours soit itérée par Loop pour vérifier si la sous-chaîne «sur» est incluse dans la colonne de cours du dataframe. Les valeurs dans lesquelles la sous-chaîne existe sont ajoutées à une liste vide «filtrée» que nous avons imprimée en sortie.

Les séries.La fonction Str »peut obtenir les valeurs de la série en tant que chaînes et effectuer diverses opérations. Pour vérifier si un modèle ou un regex est présent dans un index ou une chaîne de série, nous pouvons utiliser la «série.Str.Contient () ”Fonction en pandas. Selon un modèle ou un regex spécifié est présent dans une série ou une valeur de chaîne d'index, la méthode renvoie un index ou une série booléen.

Syntaxe: Série.Str.contient (pat, case = true, drapeaux = 0, na = nan, regex = true)

Où,

tapoter: Expression régulière ou séquence de caractères.

cas: Sensibilisation de la casse si elle est définie sur true.

Frappeurs: Drapeaux à passer par le module RE, par exemple,.Ignorecase.

n / A: Pour remplir les valeurs manquantes ou nulles.

expirat: Le PAT est considéré comme une expression régulière si elle est vraie.

Exemple n ° 4: Série d'utilisation.Str.contient () fonction pour déterminer si la sous-chaîne est présente dans les données

Tout d'abord, nous créerons une liste avec des valeurs de chaîne. Avec les pandas, nous importerons également les re-modules. Le re-module propose un ensemble de fonctionnalités d'expression régulières efficaces qui vous permettent de déterminer facilement si une chaîne fournie correspond ou contient un modèle particulier en utilisant la méthode de correspondance et en utilisant la méthode de recherche, respectivement.

Nous avons créé une liste avec PD.Série () Fonction avec la chaîne Values ​​«Team_A», «Team_AB», «Team_B», «Team_alpha», «Team_ACE», «Team_Stars» et «Team_C». Nous avons également spécifié un index pour notre série «SR» en tant que «Team 1», «Team 2», «Team 3», «Team 4», «Team 5», «Team 6» et «Team 7». Maintenant, utilisons la série.Str.Contient () Fonction pour trouver si la sous-chaîne est présente dans les valeurs de chaîne de la liste.

À l'intérieur du str.Contient () Fonction, nous avons spécifié le paramètre PAT en tant que «Team_A» pour vérifier si la sous-chaîne «Team_A» est incluse dans les valeurs de chaîne de la liste. La sortie montre qu'un objet de série contenant des valeurs booléens est renvoyé par la série.Str.Contient () fonction. Lorsque le motif fourni se trouve dans la chaîne, c'est vrai; Sinon, false est retourné.

Exemple n ° 5: Série d'utilisation.Str.contient () fonction pour déterminer si le modèle est présent dans les données

Nous allons maintenant vérifier si le modèle spécifié existe dans les données de chaîne de l'objet de la série sous-jacent. Créons une chaîne contenant des valeurs de chaîne.

Nous avons créé une série avec les valeurs «Mickey», «Rickon», «Alex», «Nick», «Rov», «Tim» et «Danny». Pour déterminer si un modèle est inclus dans les données de chaîne de l'objet de la série, nous allons maintenant utiliser la «série.Str.Contient () ”Fonction.

Nous avons spécifié Path = «I [A-Z]» pour trouver s'il y a une valeur de chaîne dans la série «S» ayant la lettre «I» suivie de tout alphabet minuscule.

Conclusion

Dans ce tutoriel, nous avons essayé d'enseigner comment déterminer si une chaîne comprend une sous-chaîne à Pandas. Cela peut être fait en utilisant plusieurs méthodes, mais nous en avons discuté quelques-unes dans les exemples. Nous avons mis en œuvre des exemples pour vous apprendre à déterminer si la chaîne contient la sous-chaîne spécifiée à l'aide de l'opérateur in, filtrez une chaîne si la sous-chaîne est présente dans une série ou un dataframe et utiliser le str.contient () fonction pour déterminer si la sous-chaîne ou l'expression est présente dans les données.