ArchiveBox

ArchiveBox

🗃 El archivo web de código abierto autohospedado.Toma el historial del navegador / marcadores / Pocket / Pinboard / etc., guarda HTML, JS, PDF, medios y más.
  • Gratis
Debido a que los sitios web modernos son complicados y a menudo dependen de contenido dinámico, ArchiveBox archiva los sitios en varios formatos diferentes más allá de lo que los servicios de archivo público como Archive.org y Archive.is son capaces de guardar.ArchiveBox importa una lista de URL de stdin, url remota o archivo, luego agrega las páginas a una carpeta de archivo local usando wget para crear un clon html navegable, youtube-dl para extraer medios y una instancia completa de Chrome sin cabeza para PDF,Captura de pantalla, volcados DOM y más ... El uso de múltiples métodos y el navegador dominante en el mercado para ejecutar JS garantiza que podamos guardar incluso los sitios web más complejos y delicados en al menos algunos formatos de datos a largo plazo y de alta calidad.### Puede importar enlaces desde: - Pocket, Pinboard, Instapaper - RSS, XML, JSON o listas de texto sin formato - Historial del navegador o marcadores (Chrome, Firefox, Safari, IE, Opera y más) - Shaarli, Delicious, RedditPublicaciones guardadas, Wallabag, Unmark.it y cualquier otro texto con enlaces.### Puede guardar estas cosas para cada sitio: - favicon.ico` favicon del sitio - `example.com / page-name.html` wget clon del sitio, con .html agregado si no está presente -` salida.pdf` PDF impreso del sitio usando Chrome sin cabeza - `screenshot.png` Captura de pantalla 1440x900 del sitio usando Chrome sin cabeza -` output.html` DOM Descarga del HTML después de renderizar usando Chrome sin cabeza - `archive.org.txt` Un enlace alsitio guardado en archive.org - `warc /` para el archivo warc html + gzipped.gz - `media /` cualquier mp4, mp3, subtítulos y metadatos encontrados usando youtube-dl - `git /` clon de cualquier repositorio para github, bitbucket o gitlab links - `index.html` &` index.json`Archivos de índice HTML y JSON que contienen metadatos y detalles El archivado es aditivo, por lo que puede programar `. / Archive` para que se ejecute regularmente y extraiga nuevos enlaces al índice.Todo el contenido guardado es estático e indexado con archivos JSON, por lo que vive para siempre y es fácilmente analizable, no requiere un backend siempre en ejecución.
archivebox

Categorias

Alternativas a ArchiveBox para todas las plataformas con cualquier licencia

Pocket

Pocket

Guarde páginas web para leer más tarde y elimine el desorden de marcadores con sitios que son simplemente de un interés único.
Wget

Wget

GNU Wget es un paquete de software gratuito para recuperar archivos usando HTTP (S) y FTP, los protocolos de Internet más utilizados.
HTTrack

HTTrack

Un servicio de copia de sitios web que descarga sitios web completos y los construye recursivamente localmente.
Wayback Machine

Wayback Machine

Navegue por más de 150 mil millones de páginas web archivadas desde 1996 hasta hace unos meses.
wallabag

wallabag

wallabag es una aplicación de código abierto autohospedable para guardar páginas web. ## Lectura cómoda
Pinboard

Pinboard

Pinboard es un archivo personal para las cosas que encuentras en línea y que no quieres olvidar.
Evernote Web Clipper

Evernote Web Clipper

Guarde todo lo que vea en línea, incluidos texto, enlaces e imágenes, en su cuenta de Evernote con un solo clic.
Archive.is

Archive.is

Archive.is le permite "tomar una foto" de una página web que siempre estará disponible, incluso si la página original cambia o se elimina.
Internet Archive

Internet Archive

Internet Archive es una biblioteca digital sin fines de lucro que ofrece acceso universal gratuito a libros, películas y música, así como 150 mil millones de páginas web archivadas.
Stash.ai

Stash.ai

Stash es una aplicación de marcadores inteligente para varios dispositivos respaldada por inteligencia artificial.Guarda artículos, videos y cualquier otra cosa.Se clasifican automáticamente para usted.
SiteSucker

SiteSucker

Aplicación macOS que descarga automáticamente sitios web de Internet.Lo hace copiando asincrónicamente las páginas web, imágenes, PDF, hojas de estilo y otros archivos del sitio en su disco duro local, duplicando la estructura de directorios del sitio.
PageArchiver

PageArchiver

PageArchiver (anteriormente llamado "Scrapbook for SingleFile") es una extensión de Chrome que te ayuda a archivar páginas web para leerlas sin conexión. Las características principales son:
Reminiscence

Reminiscence

Marcador autogestionado y administrador de archivos.Marque enlaces y edite sus metadatos (como título, etiquetas, resumen) a través de la interfaz web.
Fossilo

Fossilo

Fossilo.com archiva continuamente sitios web completos como pdf y múltiples formatos para abrirlos y verlos fácilmente sin ninguna dependencia en el futuro.Puede navegar por los archivos dentro de la plataforma o descargarlo como un paquete independiente.
WebCull

WebCull

WebCull es un organizador de enlaces diseñado para ayudarlo a ser más productivo y organizado mientras usa la web.