WebScraper Toolkit
Suite completa de scraping web: extensión Chrome, backend con API REST, scraper headless, servidor MCP para agentes de IA, y dashboard con visualización de sitemaps. Captura DOM, estilos, assets, requests de red y metadatos de cualquier sitio.
Demo Interactiva
Interactúa con una versión en vivo del producto. Sin capturas de pantalla — código real.
Funcionalidades
16 funcionalidades incluidas
Funcionalidades Core
- Captura completa de página
DOM, estilos computados, imágenes, scripts y hojas de estilo
- Crawling multi-página
Motor BFS con profundidad configurable, límite de páginas y delay entre requests
- Filtrado de URLs
Patrones glob/regex para incluir o excluir URLs durante el crawl
- Motor de paginación
Auto-detección de botones next, load-more, paginación numerada e infinite scroll
- Captura de red
Intercepción de XHR/fetch con captura de request bodies (10KB)
Stealth & Anti-detección
- Modo stealth
Rotación de User-Agent, jitter de viewport, soporte de proxy y delays aleatorios
Automatización
- Scraping programado
Jobs recurrentes con expresiones cron via API REST
Seguridad
- Perfiles de autenticación
Cookies y headers encriptados con AES-256-GCM por dominio
Monitoreo
- Detección de cambios
Hashing SHA-256, diffs línea por línea, historial de snapshots
- Feeds RSS/Atom
Descubrimiento automático de feeds y polling de items
Integraciones
- Integración YouTube
Listado de videos de canal, detalles y extracción de links de descripción
- Servidor MCP
11 herramientas para agentes de IA (Claude, etc.) via protocolo MCP
- API REST
21 endpoints con auth Bearer token, spec OpenAPI 3.0
Inteligencia de Datos
- Extracción de contactos
Emails, teléfonos, perfiles sociales, direcciones físicas y formularios de contacto
- Análisis SEO
Scoring por página y agregado por sitio con métricas detalladas
Exportación
- Multi-formato de exportación
.wst.json (optimizado para IA), CSV, PDF (resumen ejecutivo)