Micaela 23 de noviembre de 2008 a las 12.00
   Imprimir artículo
elWebmaster.com

Convertir PDFs escaneados en texto HTML con Google


Existen dos tipos de documentos PDF, aquellos que contienen im√°genes, archivos de oficina, etc. y los que fueron creados escaneando p√°ginas f√≠sicas de papel como un documento legal o alg√ļn libro.

Google siempre pudo indexar sin complicaciones los PDFs creados por conversi√≥n, pero ahora tambi√©n puede reconocer texto de PDFs generados a trav√©s del escaneo de alg√ļn documento f√≠sico.

As√≠ que si deseas convertir alg√ļn PDF de este tipo en texto reconocible una buena opci√≥n es crear una carpeta en tu sitio web, por ejemplo ‚Äúabc.com/pdf‚ÄĚ y subir en ella todas las im√°genes del PDF.

Luego, crear una p√°gina p√ļblica que linkee a todos los archivos PDFs y esperar a que los bots de Google detecten nuestros archivos.

Una vez que haya pasado esto, tipeamos “site:abc.com/pdf filetype:pdf” y podremos ver todos los PDFs como documentos HTML.

Fuente: Labnol


Enviar a Del.icio.us Enviar a Meneame Enviar a Digg Enviar a Fresqui Enviar a Enchilame

Comentarios (1)

  1. Ra√ļl Camayo Aguado dice:

    Me parece muy intersante y es justo lo que estaba buscando pero cómo puedo hacer si es no tengo un sitio web.

Deja tu opinión

© 2007 - 2008 elWebmaster.com | Powered by Wordpress | Diseño CSS y XHTML válido. | Algunos íconos basados en FamFamFam Mini
Acceder