
5
DiffBot
* Obtenga datos de páginas web automáticamente: las API de visión por computadora de Diffbot convierten la web en su base de datos.* API AUTOMÁTICAS: Extraiga automáticamente Obtenga contenido estructurado de artículos, productos y otros tipos de páginas familiares.
- De pago
- Web
¿Por qué Diffbot?Estamos enfocados exclusivamente en obtener mejores datos web.Algunas de las razones por las que cientos de clientes hacen (cientos de) millones de llamadas cada mes: #El mejor extractor de contenido de la Web: Diffbot funciona automáticamente, sin reglas ni capacitación.No hay mejor manera de extraer datos de las páginas web.Vea cómo Diffbot se compara con otros métodos de extracción de contenido: Comparación de características Extracción de texto Disparo de calidad # Identificar páginas automáticamente: use la API de análisis para buscar y extraer automáticamente todos los productos, artículos, debates o imágenes mientras rastrea cualquier sitio.Analizar API # Datos de producto detallados: La API de producto devuelve automáticamente información completa del producto, incluidos todos los datos de precios, ID de productos, marcas y tablas de especificaciones completas.API del producto # Texto limpio y html: los artículos, los hilos de discusión, las descripciones de los productos y los títulos de las imágenes se devuelven en texto puro y HTML desinfectado.Comience a probar hoy #Búsqueda estructurada: busque contenido estructurado desde cualquier rastreo sobre la marcha utilizando nuestra API de búsqueda, devolviendo solo los resultados coincidentes.Además ... ¤ Todas las API ejecutan Javascript, por lo que el contenido se analiza como un navegador normal.¤ Funciona en la mayoría de las páginas que no están en inglés gracias al procesamiento visual.¤ Normalización de fecha: las marcas de fecha se normalizan y se presentan en formato estándar RFC 1123 (HTTP / 1.1).¤ Los artículos de varias páginas se unen automáticamente en una sola respuesta API.¤ Extracción de entidad: el etiquetado automático identifica los principales temas y entidades dentro del texto del artículo.¤ Solucione cualquier problema en tiempo real con API Toolkit.¤ La API masiva permite la extracción de cientos a cientos de miles de páginas.¤ Acceda a los datos de trabajo de Crawlbot y Bulk en formatos JSON o CSV completos.¤ Opcionalmente, rastree utilizando una gran variedad de direcciones IP.
Sitio web:
https://www.diffbot.com/Caracteristicas
Categorias
Alternativas a DiffBot para todas las plataformas con cualquier licencia

56
UI.Vision Kantu
Herramienta moderna de automatización de tareas y pruebas de código abierto y Selenium IDE.Kantu es una extensión de navegador, ¡pero también puede hacer la automatización de escritorio!Úselo para automatización web, pruebas web, llenado de formularios, raspado de pantalla y automatización de procesos robóticos (RPA)..

13
ScrapeHero
Un servicio de raspado web para recopilar datos de sitios web, sin ninguna herramienta de programación o bricolaje..
- De pago
- Web

6
Webhose.io
Rastreamos la web para que no tenga que hacerlo.Nuestros rastreadores descargan y estructuran millones de publicaciones al día, almacenamos e indexamos los datos, por lo que todo lo que tiene que hacer es definir qué parte de los datos necesita.
- Freemium
- Web

3
PromptCloud
PromptCloud es un proveedor de servicios de raspado web que satisface los requisitos de big data de las empresas..
- De pago
- Web

3
Product API by Fetchee
La API automática de productos proporciona a las nuevas empresas y empresas un servicio preciso de extracción de datos de comercio electrónico a pedido.
- Freemium
- Web

2
Aggregatus
Aggregatus es un servicio que lo ayuda a agregar información del mismo significado pero de los diferentes sitios web y hacer que se pueda buscar, filtrar y ordenar como si todo fuera del sitio web.
- Gratis
- Web

2
SummarizeBot API
Resumen en varios idiomas, extracción de palabras clave, análisis de sentimientos, minería de texto, detección de rostros, reconocimiento de imágenes y herramientas de extracción de datos web.
- De pago
- Web

1
Lead Bunnies
El software de extracción de correo electrónico Leadbunnies es una poderosa extensión de Chrome que automatiza el proceso de generación de oportunidades para un negocio al raspar y validar miles de direcciones de correo electrónico de varios directorios de negocios en línea y redes sociales.

1