Encontrar todas las etiquetas del documento HTML
Vamos a utilizar el HTML de la web parascrapear.com. Si entras en la web y pinchas en Control + U, podrás ver el código HTML de esta, o poniendo en el navegador:
view-source:https://parascrapear.com/
import requests
from bs4 import BeautifulSoup
# HTML parascrapear.com
# view-source:https://parascrapear.com/
page = requests.get('https://parascrapear.com/')
soup = BeautifulSoup(page.text, 'html.parser')
filtered = soup.html.find_all(True)
for element in soup.find_all(True):
print(element.name)
OUTPUT:
html head title meta link body h1 a code div p a a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a blockquote p q p a footer a div a div div a script
¿Cansado de que te bloqueen mientras haces web scraping?
Nuestra API gestiona la navegación automática y rotación de proxies por ti.
Nuestra API gestiona la navegación automática y rotación de proxies por ti.
Como hacer scraping con Python y Beautiful Soup:
Otros ejemplos de códigos usando BeautifulSoup:
- Buscar el siguiente hermano de una etiqueta
- Buscar etiquetas por clase CSS
- Cambiar el contenido de la etiqueta
- Construir con BeautifulSoup a partir de HTML
- Extraer las URLs de todos los enlaces
- Encontrar todas las etiquetas del documento HTML
- Construir un web scraper simple
- Encontrar el hermano anterior de una etiqueta
- Buscar el elemento anterior de una etiqueta
- Encontrar el siguiente elemento después de una etiqueta