html2text

html2text

html2text es una utilidad de línea de comandos, escrita en C ++, que convierte documentos HTML en texto sin formato.
html2text es una utilidad de línea de comandos, escrita en C ++, que convierte documentos HTML en texto sin formato.Cada documento HTML se carga desde una ubicación indicada por un URI o se lee desde una entrada estándar, y se formatea en una secuencia de caracteres de texto sin formato que se escribe en la salida estándar o en un archivo de salida.El URI de entrada puede especificar un sitio remoto, desde el cual los documentos se cargan a través del Protocolo de transferencia de hipertexto (HTTP).El programa puede preservar las posiciones originales de los campos de la tabla, le permite establecer el ancho de la pantalla (a un número dado de caracteres de salida) y acepta también entradas sintácticamente incorrectas (intentando interpretarlo "razonablemente").El texto en negrita y subrayado se representa de forma predeterminada con secuencias de retroceso (que es particularmente útil cuando se canaliza la salida del programa en "menos" u otro localizador).Todas las propiedades de renderizado se pueden personalizar en gran medida a través de un archivo RC.
html2text

Categorias

Alternativas a html2text para Windows con licencia comercial