
4
Common Crawl
Common Crawl crea y mantiene un repositorio abierto de datos de rastreo web al que puede acceder y analizar cualquiera
- Gratis
- Web
Common Crawl crea y mantiene un repositorio abierto de datos de rastreo web al que puede acceder y analizar cualquiera
Sitio web:
https://commoncrawl.org/Caracteristicas
Categorias
Alternativas a Common Crawl para Self-Hosted

136
searx
Searx es un metabuscador, que agrega los resultados de otros motores de búsqueda sin almacenar información sobre sus usuarios.¿Por qué usar Searx?
- Gratis
- Self-Hosted
- Web
- Linux
- Android

30
Gigablast
¡Gigablast es un motor de búsqueda potente, de código abierto y nuevo que realiza indexación en tiempo real! Características Escalable a miles de servidores.
- Gratis
- Web
- Self-Hosted

0
Elite Proxies API
Los servidores proxy élite de vida corta se actualizan cada 1 minuto. Cada solicitud crea un nombre de host privado que caducó después de 5 minutos.
- De pago
- Self-Hosted
- Mashape