Python Regex Match

Python Regex Match
Une notation (re) est une expression de contenu particulière qui est utilisée pour indiquer un modèle spécifique dans Python. C'est phénoménal pour l'extraction de données à partir de différents types de texte. Le premier point à mentionner lors de l'utilisation d'une expression régulière montre que tout est une lettre et que nous créons des modèles pour relier une certaine séquence de mots, communément appelée chaîne. Les lettres contiennent tous les caractères spéciaux, ainsi que les entiers et les marques de ponctuation. Ceux-ci sont utilisés pour correspondre au contenu. Dans cet article, nous examinerons comment faire le match regex dans Python.

Exemple n ° 1:

La fonction Search () d'un élément recherche chaque correspondance regex dans la chaîne dont elle est fournie avec. La fonction Group () sur les entités correspondantes récupère le même contenu du texte récupéré.

Importer RE
MobnumRegex = re.compiler (r '\ d \ d \ d- \ d \ d \ d- \ d \ d \ d \ d')
num = mobnumregex.Recherche ('Le numéro est 031-837-5061.')
Imprimer ('Numéro de Mob:' + num.groupe())

Pour démarrer le programme, nous devons intégrer une bibliothèque «re» pour utiliser la fonction regex dans le code. Nous avons utilisé la fonction Regex pour le numéro de mobile aléatoire. Nous déclarons la compilé (). Dans la compilation, nous indiquons le format de l'écriture du numéro de mobile. Il y a «r» avant le format.

Dans l'étape suivante, nous initialisons une nouvelle variable «num» pour stocker le numéro de mobile. Ici, nous appliquons la fonction Regex.recherche(). Cette fonction contient le numéro de mobile requis. En fin de compte, nous avons appelé la commande print () pour obtenir la sortie. Nous avons fourni le paramètre dans la forme + num.groupe () pour récupérer l'intégralité du numéro de mobile:

Exemple n ° 2:

Dans cet exemple, nous correspondrons aux éléments à l'aide d'un format de groupe. Supposons que nous voulons séparer une section du numéro de mobile à partir de la partie restante. Dans le regex, l'insertion de supports crée des ensembles. Ensuite, nous utiliserons la fonction d'élément de correspondance du groupe () pour obtenir les données identiques à partir du seul ensemble unique.

Importer RE
MobnumRegex = re.compiler (r '(\ d \ d \ d) - (\ d \ d \ d- \ d \ d \ d \ d)')
num = mobnumregex.Recherche ('Le numéro est 031-837-5061.')
imprimer (num.Groupe (2))

Au début du code, nous devons d'abord acquérir le package «RE» qui nous permettra d'utiliser la méthode Regex dans cette instance. Pour tout numéro de téléphone mobile aléatoire, nous utilisons la méthode Regex. Le compilé () est spécifié. Nous définissons la syntaxe pour insérer le numéro de mobile dans le code.

Avant le motif, il y a un alphabet «r». Maintenant, pour créer une nouvelle variable appelée «num» qui sera utilisée pour maintenir le numéro de contact, utilisez le regex.recherche(). Le numéro de mobile nécessaire est passé dans cette méthode. Pour obtenir le résultat, nous utilisons la commande print () à la fin. Pour accéder à la deuxième partie du numéro de mobile entré, nous avons spécifié un argument dans le style + num.Groupe (2).

Exemple n ° 3:

Dans l'appariement des modèles, les parenthèses détiennent un objectif spécifique, mais même si nous devons comparer une parenthèse dans le message. Le code régional pourrait être spécifié entre parenthèses pour le numéro de mobile que nous essayons d'imiter. Dans ce cas, une barre oblique inverse est nécessaire pour séparer les éléments. Dans la ligne brute fournie à la fonction compile (), les lettres d'échappement correspondraient aux vrais éléments des supports.

Importer RE
MobnumRegex = re.compiler (r '(\ (\ d \ d \ d \)) (\ d \ d \ d- \ d \ d \ d \ d)')
num = mobnumregex.Recherche («Mon numéro de téléphone est le (015) 932-0394.')
imprimer (num.groupe 1))

Après avoir introduit la bibliothèque «RE», nous allons d'abord énoncer le format de saisie du numéro en utilisant l'alphabet «R». Nous divisons le format en deux supports de moitiés. Ensuite, nous avons fourni n'importe quel numéro. Le nombre est donné comme paramètre de la fonction regex.recherche(). La dernière ligne du code contient l'instruction print (). Dans cette commande, nous indiquons cette partie du nombre que nous voulons afficher. Alors, nous ajoutons num.groupe 1). Ici 1 montre que nous voulons récupérer le premier segment du numéro.

Exemple n ° 4:

Nous allons faire correspondre les éléments en utilisant de nombreux ensembles à l'aide du symbole '|'. Le '|' Le symbole est connu comme un tuyau. Il pourrait être utilisé lorsque nous devons comparer l'un de divers termes.

Importer RE
CountryRegex = re.compiler (R'australia | Espagne ')
CU1 = countryregex.Recherche ('Australie et l'Espagne.')
Imprimer (CU1.groupe())

Dans cet exemple, nous incluons le framework 'RE', puis nous entrons dans l'expression dans Compile () en utilisant le | Symbole sous la forme de «Australie | Espagne». Il rechercherait «Australie» ou «Espagne». Cela peut être fait avec l'aide du regex.Méthode Search (). La commande print () sera appliquée à la chaîne entrée. Si l'Australie et l'Espagne apparaissent dans l'expression récupérée, l'entité appariée serait fournie comme la première partie du contenu correspondant.

Exemple n ° 5:

Les accolades bouclées pourraient être utilisées pour corréler certaines itérations. Si nous avons un ensemble que nous aimerions reproduire une certaine multitude de fois, nous mettrons ce chiffre en accolades bouclées après avoir utilisé le regex. Pour garder le plus bas ou le plus élevé indéfini, nous éliminons la première ou la deuxième partie des accolades bouclées. Nous pouvons indiquer une plage plutôt qu'un seul point de données en entrant dans le plus bas, une virgule et le nombre le plus élevé dans les accolades bouclées.

Importer RE
Itregex = re.compiler (r '(it) 6')
Au1 = itregex.Recherche («ititititit»)
Imprimer (AU1.groupe())

Ici, nous correspondons aux répétitions en utilisant les supports. Donc, nous insérons l'argument comme (it) 6 à la fonction compile (). La valeur 6 montre que nous voulons 6 fois dans la sortie. Le regex (it) 6 serait le même que la chaîne 'ititititit'. Alors qu'il ne correspondrait pas à «itititit, car cet ensemble (il) ne sera répété que cinq fois dans ce dernier. La déclaration print () imprime toutes les répétitions.

Conclusion

Dans cet article, nous avons discuté de la façon de faire correspondre les éléments Regex dans Python et d'obtenir la partie spécifique du contenu correspondant. Nous avons exécuté différents programmes concernant les techniques utilisées pour faire correspondre les données. Nous voyons également comment faire correspondre les éléments des ensembles en utilisant des accolades bouclées et le | symbole pip. Les regex sont l'abréviation utilisée pour les chaînes régulières, qui analysent la séquence textuelle. Le composant RE comprend toutes les fonctionnalités regex. Les commandes régulières permettent aux utilisateurs de rechercher une certaine séquence de contenu.