Tesseract

Tesseract

Tesseract.js es una biblioteca de JavaScript que obtiene palabras en casi cualquier idioma de las imágenes.
Tesseract.js es una biblioteca de JavaScript que obtiene palabras en casi cualquier idioma de las imágenes.El motor Tesseract OCR fue uno de los 3 motores principales en la prueba de precisión UNLV de 1995.Entre 1995 y 2006 tuvo poco trabajo, pero probablemente sea uno de los motores OCR de código abierto más precisos disponibles.El código fuente leerá una imagen binaria, gris o en color y texto de salida.Se ha incorporado un lector tiff que leerá imágenes TIFF sin comprimir, o se puede agregar libtiff para leer imágenes comprimidas.Hay archivos de idioma para muchos idiomas, incluso para el texto configurado en Fraktur y tipos de letra blackletter ...
tesseract

Caracteristicas

Alternativas a Tesseract para Linux

GImageReader

GImageReader

gImageReader es un simple front-end Gtk / Qt para el motor Tesseract OCR.Características: - Importe documentos PDF e imágenes desde disco, dispositivos de escaneo, portapapeles y capturas de pantalla
CuneiForm

CuneiForm

CuneiForm (OpenOCR) es un software de reconocimiento de texto para plantillas impresas.Manuscritos o archivos PDF, sin embargo, el programa no puede reconocer las estructuras de las tablas.
CopyFish

CopyFish

Extraiga y traduzca texto de imágenes / videos / PDF en cualquier sitio web.
OCRFeeder

OCRFeeder

OCRFeeder es un sistema de análisis de diseño de documentos y reconocimiento óptico de caracteres.
GOCR

GOCR

GOCR es un programa de reconocimiento óptico de caracteres (OCR), desarrollado bajo la licencia pública GNU.Convierte imágenes escaneadas de texto a archivos de texto.
OCRopus

OCRopus

OCRopus (tm) es un sistema de análisis de documentos y OCR de última generación, que presenta análisis de diseño conectable, reconocimiento de caracteres conectables, modelado estadístico de lenguaje natural ...
VietOCR

VietOCR

Una interfaz Java / .NET GUI para el motor Tesseract OCR.Admite el reconocimiento óptico de caracteres para el idioma vietnamita.
OCRmyPDF

OCRmyPDF

OCRmyPDF agrega una capa de texto OCR a los archivos PDF escaneados, lo que permite buscarlos o copiarlos.
WatchOCR

WatchOCR

WatchOCR es un servidor de OCR de código abierto que crea archivos PDF con capacidad de búsqueda a partir de imágenes en una carpeta vigilada.
YAGF

YAGF

YAGF, otro front-end gráfico para CuneiForm, es una interfaz gráfica para ...