
71
Tesseract.js es una biblioteca de JavaScript que obtiene palabras en casi cualquier idioma de las imágenes.El motor Tesseract OCR fue uno de los 3 motores principales en la prueba de precisión UNLV de 1995.Entre 1995 y 2006 tuvo poco trabajo, pero probablemente sea uno de los motores OCR de código abierto más precisos disponibles.El código fuente leerá una imagen binaria, gris o en color y texto de salida.Se ha incorporado un lector tiff que leerá imágenes TIFF sin comprimir, o se puede agregar libtiff para leer imágenes comprimidas.Hay archivos de idioma para muchos idiomas, incluso para el texto configurado en Fraktur y tipos de letra blackletter ...
Sitio web:
https://github.com/tesseract-ocr/tesseractCaracteristicas
Categorias
Alternativas a Tesseract para Linux

35
GImageReader
gImageReader es un simple front-end Gtk / Qt para el motor Tesseract OCR.Características: - Importe documentos PDF e imágenes desde disco, dispositivos de escaneo, portapapeles y capturas de pantalla

9

8

6

5

5

4

4

3