Existen dos tipos de documentos PDF, aquellos que contienen imágenes, archivos de oficina, etc. y los que fueron creados escaneando páginas fÃsicas de papel como un documento legal o algún libro.
Google siempre pudo indexar sin complicaciones los PDFs creados por conversión, pero ahora también puede reconocer texto de PDFs generados a través del escaneo de algún documento fÃsico.
Asà que si deseas convertir algún PDF de este tipo en texto reconocible una buena opción es crear una carpeta en tu sitio web, por ejemplo “abc.com/pdf†y subir en ella todas las imágenes del PDF.
Luego, crear una página pública que linkee a todos los archivos PDFs y esperar a que los bots de Google detecten nuestros archivos.
Una vez que haya pasado esto, tipeamos “site:abc.com/pdf filetype:pdf” y podremos ver todos los PDFs como documentos HTML.
Fuente: Labnol








Martes, 3 de Marzo de 2009 a las 01.29
Me parece muy intersante y es justo lo que estaba buscando pero cómo puedo hacer si es no tengo un sitio web.