Taller de Web Scraping con Python


ACTIVIDADES DEL TALLER
(24 horas, 6 sesiones)

El taller se imparte de manera online en vivo vía Zoom, todas las clases son grabadas por si los/las asistentes llegan a faltar.

SESIÓN 1
- ¿Qué es el Web Scraping?
- Introducción al desarrollo de sitios y sistemas web, ¿Cómo están creados? ¿Con qué tecnologías? ¿Cómo funcionan?
- Tipos de Sitios Web
- Web Scraping vs. API's
- Pasos generales para realizar Web Scraping
- Herramientas para Web Scraping con Python que utilizaremos en el taller (beautiful soup, scrapy, selenium, etc)
- ¿El Web Scraping es legal?
- Sitios Web Estáticos
- Práctica 1: Scraping de un Sitio Web Estático
SESIÓN 2
- Sitios Web Dinámicos
- Beautiful Soup
- Introducción a expresiones regulares
- Práctica 2: Scraping de un Sitio Web donde todos sus elementos se cargan en una sola página
- Practica 3: Scraping de un Sitio Web donde se muestra una cierta cantidad de elementos y hay paginación
SESIÓN 3
- Sitios Web Dinámicos
- Scrapy Framework
- Introducción a XPath
- Práctica 4: Scraping de un Sitio Web donde todos sus elementos se cargan en una sola página
- Practica 5: Scraping de un Sitio Web donde se muestra una cierta cantidad de elementos y hay paginación
SESIÓN 4
- Sitios Web Dinámicos y SPA's
- Sitios en los que beautiful soup y scrappy no pueden llegar
- Selenium
- Práctica 6: Scraping de Sitios Web con Selenium
SESIÓN 5
- Sitios Web Dinámicos y SPA's
- Práctica 7: Scraping de Sitio Web con popup links
- Práctica 8: Scraping de Sitio Web con paginación tipo AJAX
SESIÓN 6
- Sitios Web Dinámicos y SPA's
- Práctica 9: Scraping de Sitio Web con botón de cargar más
- Práctica 10: Scraping de Sitio Web con carga inifinita al realizar scrolling