Encontrar el hermano anterior de una etiqueta
Vamos a utilizar el HTML de la web parascrapear.com. Si entras en la web y pinchas en Control + U, podrás ver el código HTML de esta, o poniendo en el navegador:
view-source:https://parascrapear.com/
import requests
from bs4 import BeautifulSoup
# HTML parascrapear.com
# view-source:https://parascrapear.com/
page = requests.get('https://parascrapear.com/')
soup = BeautifulSoup(page.text, 'html.parser')
print(soup.body)
# OUTPUT: <body>
# ...
# </body>
print(soup.body.previous_sibling)
# OUTPUT:
print(soup.body.previous_sibling.previous_sibling)
# OUTPUT: <head>
# ParaScrapear.com
#
#
# </head>
¿Cansado de que te bloqueen mientras haces web scraping?
Nuestra API gestiona la navegación automática y rotación de proxies por ti.
Nuestra API gestiona la navegación automática y rotación de proxies por ti.
Como hacer scraping con Python y Beautiful Soup:
Otros ejemplos de códigos usando BeautifulSoup:
- Buscar el siguiente hermano de una etiqueta
- Buscar etiquetas por clase CSS
- Cambiar el contenido de la etiqueta
- Construir con BeautifulSoup a partir de HTML
- Extraer las URLs de todos los enlaces
- Encontrar todas las etiquetas del documento HTML
- Construir un web scraper simple
- Encontrar el hermano anterior de una etiqueta
- Buscar el elemento anterior de una etiqueta
- Encontrar el siguiente elemento después de una etiqueta