Ir al contenido principal

Editar texto escaneado con OCRFeeder

Bueno soy Norman (como Norman Bates xD) y a partir de hoy formaré parte de este equipo esperando ayudar y complementar en el desarrollo de este sitio y fomentar el uso de Ubuntu y sus interesantes aplicaciones. Puedo contarles que desde mi experiencia con Ubuntu (ya casi dos años) lo increíblemente versátil que resulta ser este sistema operativo y es por eso que he tratado de difundir la palabra respecto al uso de Ubuntu y ahora quiero colaborar con este sitio que me ayudo en mis comienzos para así poder ayudar a otros en sus inicios con Ubuntu. ah otros datos anexos tipo CV; soy chileno, de la cuarta región (la mejor xD visítenla), pero estudio en Valparaíso Ing. Electrónica.
Ahora a lo nuestro:
OCRFeeder es un analizador de documentos capaz de realizar reconocimiento de caracteres ópticos del sistema es un excelente OCR para GNU/Linux.
Bueno primero debemos instalar motores OCR en en Lucid
sudo apt-get install tesseract-ocr gocr ocrad
Nota: podemos usar estos motores desde la consola
Instalamos algunas librerías necesarias:
sudo apt-get install python-pygoocanvas unpaper
Después instalamos el OCRFeeder para debian:
sudo apt-get install ocrfeeder
Para ubuntu lucid:
ocrfeeder_0.6.6-1_all.deb


Ahora vamos a probar OCRFeeder


Seleccionamos nuestro motor preferido en mi caso Ocrad puesto que me funciono mejor que Tesseract.
Podemos analizar todo el texto de una sola vez o seleccionar una parte del texto:
Ir a documento> reconocer áreas seleccionadas
si no nos gusta como el motor analizó el texto podemos cambiarlo en propiedades del texto por Ocrad o Tesseract y le damos clic en OCR.
Al momento de escanear si no nos gusta el simple-scan que viene en lucid podemos instalar xsane:
sudo apt-get install xsane
En general el programa analizó muy bien el texto salvo algunas pocas palabras pero nos puede sacar de apuro en algunas ocasiones.

EXTRA

Bueno para los que no tienen un scanner podemos darle otra utilidad a este programa (en realidad a gocr) y es la de leer captchas simples. Primero creamos el directorio donde guardar las capturas.

mkdir /home/usuario/captchas
gocr -d 2 -p /home/usuario/captchas -m 256 -m 130 captcha.png

 
Este programa necesita un entrenamiento previo por así decirlo para poder descifrar las captchas, entonces después de ejecutar el comando
nos aparece en la consola la primera letra de la captcha.
Como se ve en la imagen hay que teclear la letra que aparece escrita con “#” hasta completar la captcha. Cuando se tenga suficientes capturas el programa será capaz de reconocerlas automáticamente.

Entradas populares de este blog

ISO Master, crea y modifica tus ISO’s fácilmente

<a href="http://ubuntu.com/getubuntu" title="Descarga Ubuntu"> <img src="http://www.marcelor.com/wp-content/uploads/199_164_ubuntu.png" alt="Descarga Ubuntu."/> </a> Ha sido liberada la versión 1.3.7 de ISO Master, aplicación que te permite crear y modificar archivos ISO9660 (imágenes ISO). Principales funcionalidades: Crear una imagen ISO desde el principio. Añadir o eliminar archivos y directorios en o desde una imagen de CD. Crear CDs de arranque utilizando diferentes tipos de registros de arranque: no emulación (isolinux, Microsoft Windows), 1,2, 1,44 y 2,88 de emulación de disquete. Apoyo a Rock Ridge y nombres de archivo Joliet. Iso Master es una aplicación de código abierto y está disponible en versión linux y windows. No disponible aún en los repositorios de Ubuntu http://www.littlesvr.ca/isomaster/download/

Reproducir Full-HD con VLC

Antes que nada aclaro que no van a poder ver CUALQUIER VIDEO en Full-HD. Depende mucho el bitrate. Probé con varios trailers y anda bien, pero videos de mayor bitrate van a seguir dando saltos. El problema insalvable es que el procesador Intel Atom N270 a 1.6ghz no tiene el poder de proceso necesario para poder ver sin problemas videos más pesados. Con probar de todas formas no se pierde nada, así que empecemos: Abrimos VLC . Nos dirigimos al menú Tools y Preferences. Abajo a la izquierda donde dice Show Settings cliqueamos en All . A la izquierda nos metemos en Input / Codecs > Video-codecs > FFmpeg . A la derecha tildamos Allow speed tricks , y donde dice Skip the loop filter for H.264 decoding , seleccionamos All. Abajo de eso, tildamos Hardware Decoding. Les quedaría así:

Heimdall: Odin Alternative That Runs On Linux (Tool To Flash ROMs On Samsung Galaxy S Devices)

Heimdall is a cross-platform (runs on Linux, Windows and Mac OSX), open source Odin alternative which uses the same protocol as Odin to interact with a device in download mode, that can be used to flash Android ROMs or Kernels onto Samsung Galaxy S phones. The application officially supports Samsung Galaxy S GT-I9000 (8GB) from UK and Galaxy S GT-I9000 (16GB) from Australia, but users have reported that it also works with the Captivate, Vibrant, Fascinate, Mesmerize, Epic 4G, Galaxy S 4G, Infuse 4G, GT-I9000T, Galaxy Tab (7 and 10.1 inches), Galaxy S II, and the international GT-I9000. And indeed, at least for Samsung Galaxy S II, I can confirm that Heimdall works as I've tested it myself. Before using Heimdall, remember that flashing has the potential to brick your phone so use it carefully! Flashing ROMs onto your device may also void your warranty! For the steps required to flash an Android ROM from Linux onto your Samsung device using Hei...