Ir al contenido principal

Editar texto escaneado con OCRFeeder

Bueno soy Norman (como Norman Bates xD) y a partir de hoy formaré parte de este equipo esperando ayudar y complementar en el desarrollo de este sitio y fomentar el uso de Ubuntu y sus interesantes aplicaciones. Puedo contarles que desde mi experiencia con Ubuntu (ya casi dos años) lo increíblemente versátil que resulta ser este sistema operativo y es por eso que he tratado de difundir la palabra respecto al uso de Ubuntu y ahora quiero colaborar con este sitio que me ayudo en mis comienzos para así poder ayudar a otros en sus inicios con Ubuntu. ah otros datos anexos tipo CV; soy chileno, de la cuarta región (la mejor xD visítenla), pero estudio en Valparaíso Ing. Electrónica.
Ahora a lo nuestro:
OCRFeeder es un analizador de documentos capaz de realizar reconocimiento de caracteres ópticos del sistema es un excelente OCR para GNU/Linux.
Bueno primero debemos instalar motores OCR en en Lucid
sudo apt-get install tesseract-ocr gocr ocrad
Nota: podemos usar estos motores desde la consola
Instalamos algunas librerías necesarias:
sudo apt-get install python-pygoocanvas unpaper
Después instalamos el OCRFeeder para debian:
sudo apt-get install ocrfeeder
Para ubuntu lucid:
ocrfeeder_0.6.6-1_all.deb


Ahora vamos a probar OCRFeeder


Seleccionamos nuestro motor preferido en mi caso Ocrad puesto que me funciono mejor que Tesseract.
Podemos analizar todo el texto de una sola vez o seleccionar una parte del texto:
Ir a documento> reconocer áreas seleccionadas
si no nos gusta como el motor analizó el texto podemos cambiarlo en propiedades del texto por Ocrad o Tesseract y le damos clic en OCR.
Al momento de escanear si no nos gusta el simple-scan que viene en lucid podemos instalar xsane:
sudo apt-get install xsane
En general el programa analizó muy bien el texto salvo algunas pocas palabras pero nos puede sacar de apuro en algunas ocasiones.

EXTRA

Bueno para los que no tienen un scanner podemos darle otra utilidad a este programa (en realidad a gocr) y es la de leer captchas simples. Primero creamos el directorio donde guardar las capturas.

mkdir /home/usuario/captchas
gocr -d 2 -p /home/usuario/captchas -m 256 -m 130 captcha.png

 
Este programa necesita un entrenamiento previo por así decirlo para poder descifrar las captchas, entonces después de ejecutar el comando
nos aparece en la consola la primera letra de la captcha.
Como se ve en la imagen hay que teclear la letra que aparece escrita con “#” hasta completar la captcha. Cuando se tenga suficientes capturas el programa será capaz de reconocerlas automáticamente.

Entradas populares de este blog

Fallo al obtener la lista de compartición del servidor

 - Ubuntu Karmic Koala El problema. El detalle es que a veces tengo que revisar archivos que están en otras computadoras que utilizan windows. Al momento de darle en el menú Lugares - Red - Red de Windows y al elegir el grupo de trabajo en el que están mis equipos me aparece el siguiente error. No se puede montar el lugar. Fallo al obtener la lista de compartición del servidor. La solución . La encontré en este articulo de los Foros de Ubuntu, lo voy a copiar tal cual, espero que no le moleste al autor y solo a manera de respaldo. # — Aquí inicia el articulo de los foros de Ubuntu – 1- En principio es necesario que estén instalados: samba samba-common smbclient winbind   2- Luego editar el archivo /etc/samba/smb.conf sudo gedit /etc/samba/smb.conf   A los cambios necesarios para adaptar el sistema, según los tutoriales de samba es necesario tener presente que: a- Donde dice workgroup = WORKGROUP, reemplazar WORKGROUP por el nombre de grupo de ...

Descargar Packet Tracer 5.2 [Windows y Linux]

Packet Tracer 5.2 [Windows y Linux] Packet Tracer es la herramienta de aprendizaje y simulación de redes interactiva para los instructores y alumnos de Cisco CCNA. Esta herramienta les permite a los usuarios crear topologías de red, configurar dispositivos, insertar paquetes y simular una red con múltiples representaciones visuales. Packet Tracer se enfoca en apoyar mejor los protocolos de redes que se enseñan en el currículum de CCNA. Este producto tiene el propósito de ser usado como un producto educativo que brinda exposición a la interfaz comando – línea de los dispositivos de Cisco para practicar y aprender por descubrimiento. Packet Tracer 5.2 es la última versión del simulador de redes de Cisco Systems, herramienta fundamental si el alumno está cursando el CCNA o se dedica al networking. En este programa se crea la topología física de la red simplemente arrastrando los dispositivos a la pantalla. Luego clickando en ellos se puede ingresar ...

Mensaje de bienvenida en la Consola

Es una pequeña utilidad para mostrar texto ASCII en la consola. Se llama Figlet y la podemos instalar en Ubuntu con “sudo apt-get install figlet”. Podemos hacer que aparezca un mensaje de bienvenida en la consola si añadimos estas lineas al archivo “$HOME/.bashrc”: #Mensaje figlet “Texto Que quieras $USER”