71
Tesseract.js es una biblioteca de JavaScript que obtiene palabras en casi cualquier idioma de las imágenes.El motor Tesseract OCR fue uno de los 3 motores principales en la prueba de precisión UNLV de 1995.Entre 1995 y 2006 tuvo poco trabajo, pero probablemente sea uno de los motores OCR de código abierto más precisos disponibles.El código fuente leerá una imagen binaria, gris o en color y texto de salida.Se ha incorporado un lector tiff que leerá imágenes TIFF sin comprimir, o se puede agregar libtiff para leer imágenes comprimidas.Hay archivos de idioma para muchos idiomas, incluso para el texto configurado en Fraktur y tipos de letra blackletter ...