Python demande à extraire le corps de réponse HTTP

Python demande à extraire le corps de réponse HTTP
Cet article vous apprendra à extraire le corps HTML d'une réponse HTTP à l'aide de la bibliothèque de requêtes.

Installation de demandes

Avant de poursuivre ce tutoriel, vous assurer que le package de demandes installé dans votre environnement est bon.

Vous pouvez exécuter la commande si vous utilisez PIP:

$ Sudo Pip Installer les demandes
$ Sudo Pip3 Installer les demandes

Pour les utilisateurs d'Anaconda, vous pouvez utiliser la commande:

$ sudo conda install -c anaconda requêtes

Faire une demande HTTP

L'exemple suivant montre comment utiliser la méthode des demandes pour faire une demande à une ressource donnée sur le Web.

Demandes d'importation
réponse = demandes.get ('http: // google.com ')

L'exemple ci-dessus commence par importer le package de demandes. Nous faisons ensuite une demande de GET à l'URL spécifiée. Cela devrait renvoyer un objet de réponse que nous enregistrons dans un objet de réponse.

Extraire le corps HTML de l'objet de réponse

Nous pouvons utiliser la méthode de contenu pour extraire le corps HTML de l'objet de réponse, qui renvoie le contenu de la réponse.

Un exemple de code est comme indiqué:

Demandes d'importation
réponse = demandes.get ('https: // google.com ')
imprimer (réponse.contenu)

La requête ci-dessus doit renvoyer le corps HTTP comme indiqué:

Vous pouvez ensuite écrire le contenu HTML résultant dans un fichier HTML.

Conclusion

Dans ce bref article, vous avez appris à utiliser la réponse.Méthode contenu () pour extraire le corps HTML d'un objet de réponse.