09-02-2006, 07:19 AM
Google ha liberado, con licencia 'Open Source', parte de la tecnología OCR que utilizan dentro de la compañía. Se trata de 'Tesserat OCR', y son unas librerías C/C++ de desarrollo, creadas originalmente por HP entre 1985 y 1995, y que fueron abandonadas hasta que Google y la Universidad de Nevada Las Vegas han retomado el proyecto.
Se dice como resultado a las críticas que estaba recibiendo la calidad de los documentos PDF de 'Google Books', los cuales no permiten acceder a los textos, y solamente podemos ver las páginas de los libros en forma de imágenes.
http://google-code-updates.blogspot.com/...t-ocr.html
Se dice como resultado a las críticas que estaba recibiendo la calidad de los documentos PDF de 'Google Books', los cuales no permiten acceder a los textos, y solamente podemos ver las páginas de los libros en forma de imágenes.
http://google-code-updates.blogspot.com/...t-ocr.html