OCR en Linux

Estándar

Estos días me puse a pasar unas hojas de estadística a formato ODT y lo mas frustrante es copiar todas esas lineas a la computadora y mas cuando tu velocidad con el teclado no es nada rapida, lo mejor es usar un software que se encargue de eso, y precisamente para eso esta Tesseract, Tesseract es un motor OCR libre. Fue desarrollado originalmente por HP como software propietario. Tras diez años sin ningún desarrollo fue liberado, Tesseract es desarrollado actualmente por Google.

Este programa trabaja desde consola y en verdad es muy potente y preciso solo necesitamos:

-tesseract-ocr
-imagemagick Continuar leyendo

Anuncios