Common Crawl

Common Crawl

Common Crawl crea y mantiene un repositorio abierto de datos de rastreo web al que puede acceder y analizar cualquiera
Common Crawl crea y mantiene un repositorio abierto de datos de rastreo web al que puede acceder y analizar cualquiera
common-crawl

Caracteristicas

Alternativas a Common Crawl para Self-Hosted

searx

searx

Searx es un metabuscador, que agrega los resultados de otros motores de búsqueda sin almacenar información sobre sus usuarios.¿Por qué usar Searx?
Gigablast

Gigablast

¡Gigablast es un motor de búsqueda potente, de código abierto y nuevo que realiza indexación en tiempo real! Características Escalable a miles de servidores.
Elite Proxies API

Elite Proxies API

Los servidores proxy élite de vida corta se actualizan cada 1 minuto. Cada solicitud crea un nombre de host privado que caducó después de 5 minutos.