DiffBot

DiffBot

* Obtenga datos de páginas web automáticamente: las API de visión por computadora de Diffbot convierten la web en su base de datos.* API AUTOMÁTICAS: Extraiga automáticamente Obtenga contenido estructurado de artículos, productos y otros tipos de páginas familiares.
¿Por qué Diffbot?Estamos enfocados exclusivamente en obtener mejores datos web.Algunas de las razones por las que cientos de clientes hacen (cientos de) millones de llamadas cada mes: #El mejor extractor de contenido de la Web: Diffbot funciona automáticamente, sin reglas ni capacitación.No hay mejor manera de extraer datos de las páginas web.Vea cómo Diffbot se compara con otros métodos de extracción de contenido: Comparación de características Extracción de texto Disparo de calidad # Identificar páginas automáticamente: use la API de análisis para buscar y extraer automáticamente todos los productos, artículos, debates o imágenes mientras rastrea cualquier sitio.Analizar API # Datos de producto detallados: La API de producto devuelve automáticamente información completa del producto, incluidos todos los datos de precios, ID de productos, marcas y tablas de especificaciones completas.API del producto # Texto limpio y html: los artículos, los hilos de discusión, las descripciones de los productos y los títulos de las imágenes se devuelven en texto puro y HTML desinfectado.Comience a probar hoy #Búsqueda estructurada: busque contenido estructurado desde cualquier rastreo sobre la marcha utilizando nuestra API de búsqueda, devolviendo solo los resultados coincidentes.Además ... ¤ Todas las API ejecutan Javascript, por lo que el contenido se analiza como un navegador normal.¤ Funciona en la mayoría de las páginas que no están en inglés gracias al procesamiento visual.¤ Normalización de fecha: las marcas de fecha se normalizan y se presentan en formato estándar RFC 1123 (HTTP / 1.1).¤ Los artículos de varias páginas se unen automáticamente en una sola respuesta API.¤ Extracción de entidad: el etiquetado automático identifica los principales temas y entidades dentro del texto del artículo.¤ Solucione cualquier problema en tiempo real con API Toolkit.¤ La API masiva permite la extracción de cientos a cientos de miles de páginas.¤ Acceda a los datos de trabajo de Crawlbot y Bulk en formatos JSON o CSV completos.¤ Opcionalmente, rastree utilizando una gran variedad de direcciones IP.
diffbot

Caracteristicas

Categorias

Alternativas a DiffBot para Node.JS con licencia comercial