Buscar etiquetas por clase CSS
Vamos a utilizar el HTML de la web parascrapear.com. Si entras en la web y pinchas en Control + U, podrás ver el código HTML de esta, o poniendo en el navegador:
view-source:https://parascrapear.com/
import requests
from bs4 import BeautifulSoup
# HTML parascrapear.com
# view-source:https://parascrapear.com/
page = requests.get('https://parascrapear.com/')
soup = BeautifulSoup(page.text, 'html.parser')
categories = soup.find_all(class_="cat")
print(categories)
#OUTPUT: [Sociedad, Sociedad, Naturaleza, Defectos, Miscelánea, Pensamiento y razón, Miscelánea, Sociedad, Sociedad, Arte, Pensamiento y razón, Sociedad, Miscelánea, Sentimientos, Sociedad, Sociedad, Sentimientos, Sentimientos, Naturaleza, Sociedad]
¿Cansado de que te bloqueen mientras haces web scraping?
Nuestra API gestiona la navegación automática y rotación de proxies por ti.
Nuestra API gestiona la navegación automática y rotación de proxies por ti.
Como hacer scraping con Python y Beautiful Soup:
Otros ejemplos de códigos usando BeautifulSoup:
- Buscar el siguiente hermano de una etiqueta
- Buscar etiquetas por clase CSS
- Cambiar el contenido de la etiqueta
- Construir con BeautifulSoup a partir de HTML
- Extraer las URLs de todos los enlaces
- Encontrar todas las etiquetas del documento HTML
- Construir un web scraper simple
- Encontrar el hermano anterior de una etiqueta
- Buscar el elemento anterior de una etiqueta
- Encontrar el siguiente elemento después de una etiqueta