Micaela Domingo, 23 de Noviembre de 2008 a las 12.00
   Imprimir artículo
elWebmaster.com

Convertir PDFs escaneados en texto HTML con Google

Existen dos tipos de documentos PDF, aquellos que contienen imágenes, archivos de oficina, etc. y los que fueron creados escaneando páginas físicas de papel como un documento legal o algún libro.

Google siempre pudo indexar sin complicaciones los PDFs creados por conversión, pero ahora también puede reconocer texto de PDFs generados a través del escaneo de algún documento físico.

Así que si deseas convertir algún PDF de este tipo en texto reconocible una buena opción es crear una carpeta en tu sitio web, por ejemplo “abc.com/pdf” y subir en ella todas las imágenes del PDF.

Luego, crear una página pública que linkee a todos los archivos PDFs y esperar a que los bots de Google detecten nuestros archivos.

Una vez que haya pasado esto, tipeamos “site:abc.com/pdf filetype:pdf” y podremos ver todos los PDFs como documentos HTML.

Fuente: Labnol

Enviar a Del.icio.us Enviar a Meneame Enviar a Digg Enviar a Fresqui Enviar a Enchilame

Deja tu opinión

© 2007 - 2008 elWebmaster.com | Powered by Wordpress | Diseño CSS y XHTML válido. | Algunos íconos basados en FamFamFam Mini
Iniciar Sesión