Jorge Alberto Mussuto Sr.

Jorge Alberto Mussuto Sr.
Somewhere in Massachusetts ®

Tuesday, June 22, 2010

Google Docs introduce reconocimiento OCR para reconocer texto en PDFs y en imágenes

Google Docs introduce reconocimiento OCR para reconocer texto en PDFs y en imágenes: "

google docs ocr pdf reconocimiento texto

Google acaba de añadir una opción interesante en su suite ofimática online: la posibilidad de poder subir una imagen o un archivo PDF al servicio y que éste pueda reconocer los caracteres utilizando el sistema de reconocimiento OCR y convertirlos en un documento editable.

El reconocimiento de caracteres OCR es un sistema que seguro que os suena si tenéis un escáner: detecta caracteres a partir de una imagen y los convierte a texto plano, de modo que podemos por ejemplo escanear un libro y transcribirlo automáticamente sin tener que copiarlo nosotros a mano. Google sencillamente ha trasladado este sistema de reconocimiento en Google Docs.

De todos modos los resultados, tras probar la conversión de un PDF a un documento editable, no es que sean ideales. La conversión omite todas las imágenes, y si quieres transcribir un PDF con ilustraciones pasarás a tener un texto plano (que no siempre es correcto) sin retornos de línea ni las ilustraciones. Menos da una piedra, pero esperemos que Google poco a poco vaya mejorando esta funcionalidad.

Vía | Google OS



"

No comments:

Blog Archive

Quilts

Where am I?