
0
Newspaper
Newspaper es una extracción de metadatos de noticias, texto completo y artículos construida con Python 3. CARACTERÍSTICAS - Funciona en más de 10 idiomas (inglés, chino, alemán, árabe, ...) - Marco de descarga de artículos multiproceso - Identificación de URL de noticias -Extracción de texto desde html - Extracción de imagen superior desde html - Extracción de toda imagen desde html - Extracción de palabras clave desde texto - Extracción de resumen desde texto - Extracción de autor desde texto - Extracción de términos de tendencias de Google
Sitio web:
http://newspaper.readthedocs.io/Categorias
Alternativas a Newspaper para todas las plataformas con cualquier licencia

13
ScrapeHero
Un servicio de raspado web para recopilar datos de sitios web, sin ninguna herramienta de programación o bricolaje..
- De pago
- Web

0
artoo.js
artoo.js es un fragmento de código JavaScript destinado a ejecutarse en la consola de su navegador para proporcionarle algunas utilidades de raspado.
- Gratis
- Chrome
- JavaScript
- Node.JS
- Web
- Self-Hosted