Tesseract

Tesseract.js es una biblioteca de JavaScript que obtiene palabras en casi cualquier idioma de las imágenes.

Gratis
Windows
Mac
Linux

Tesseract.js es una biblioteca de JavaScript que obtiene palabras en casi cualquier idioma de las imágenes.El motor Tesseract OCR fue uno de los 3 motores principales en la prueba de precisión UNLV de 1995.Entre 1995 y 2006 tuvo poco trabajo, pero probablemente sea uno de los motores OCR de código abierto más precisos disponibles.El código fuente leerá una imagen binaria, gris o en color y texto de salida.Se ha incorporado un lector tiff que leerá imágenes TIFF sin comprimir, o se puede agregar libtiff para leer imágenes comprimidas.Hay archivos de idioma para muchos idiomas, incluso para el texto configurado en Fraktur y tipos de letra blackletter ...

Sitio web:

https://github.com/tesseract-ocr/tesseract

Caracteristicas

Categorias

Oficina y productividad

Alternativas a Tesseract para Linux

GImageReader

gImageReader es un simple front-end Gtk / Qt para el motor Tesseract OCR.Características: - Importe documentos PDF e imágenes desde disco, dispositivos de escaneo, portapapeles y capturas de pantalla

Gratis
Windows
Linux

CuneiForm

CuneiForm (OpenOCR) es un software de reconocimiento de texto para plantillas impresas.Manuscritos o archivos PDF, sin embargo, el programa no puede reconocer las estructuras de las tablas.

Gratis
Windows
Mac
Linux

CopyFish

Extraiga y traduzca texto de imágenes / videos / PDF en cualquier sitio web.

OCRFeeder

OCRFeeder es un sistema de análisis de diseño de documentos y reconocimiento óptico de caracteres.

Gratis
Linux

GOCR

GOCR es un programa de reconocimiento óptico de caracteres (OCR), desarrollado bajo la licencia pública GNU.Convierte imágenes escaneadas de texto a archivos de texto.

Gratis
Windows
Linux

OCRopus

OCRopus (tm) es un sistema de análisis de documentos y OCR de última generación, que presenta análisis de diseño conectable, reconocimiento de caracteres conectables, modelado estadístico de lenguaje natural ...

Gratis
Linux

VietOCR

Una interfaz Java / .NET GUI para el motor Tesseract OCR.Admite el reconocimiento óptico de caracteres para el idioma vietnamita.

Gratis
Windows
Mac
Linux

OCRmyPDF

OCRmyPDF agrega una capa de texto OCR a los archivos PDF escaneados, lo que permite buscarlos o copiarlos.

Gratis
Mac
Linux

WatchOCR

WatchOCR es un servidor de OCR de código abierto que crea archivos PDF con capacidad de búsqueda a partir de imágenes en una carpeta vigilada.

Gratis
Linux

YAGF

YAGF, otro front-end gráfico para CuneiForm, es una interfaz gráfica para ...

Gratis
Linux