-
Navigation dans l'arbre
BeautifulSoup permet de naviguer au sein de l'arbre créé lors de l'analyse syntaxique d'un document X(HTML).
Après la création de l'objet BS4 :
from bs4 import BeautifulSoup
import requests
u="https://fr.wikipedia.org/wiki/Beautiful_Soup"
soup = BeautifulSoup(requests.get(u))
Pour écrire le contenu de la balise h1 :
soup.h1
Ce qui donne comme résultat :
<h1 class="firstHeading" id="firstHeading" lang="fr"><span lang="en">Beautiful Soup</span></h1>
Pour afficher le contenue de la première balise h2 :
soup.h2
<h2><span class="mw-headline" id="Exemple_d.27utilisation">Exemple d'utilisation</span><span class="mw-editsection"><span class="mw-editsection-bracket">[</span><a class="mw-editsection-visualeditor" href="/w/index.php?title=Beautiful_Soup&veaction=edit&vesection=1" title="Modifier la section : Exemple d'utilisation">modifier</a><span class="mw-editsection-divider"> | </span><a href="/w/index.php?title=Beautiful_Soup&action=edit&section=1" title="Modifier la section : Exemple d'utilisation">modifier le code</a><span class="mw-editsection-bracket">]</span></span></h2>
BS4 permet aussi de naviguer vers les ascendants, les descendants, les frères...les éléments suivants ou précédents.
Ainsi :
soup.h1.next_element
Retourne :
<span lang="en">Beautiful Soup</span>
-
Commentaires