Juan Manuel 13 de Marzo de 2008 a las 11.50
   Imprimir artículo
elWebmaster.com

¿Por qué tu sitio no aparece en los buscadores?

¿Está tu sitio indexado en Google y otros buscadores?Nunca llegaremos al primer puesto en Google si les ponemos trabas a los spider-bots. Pero no creo que nadie lo haga a propósito, por eso deberíamos estar bien seguros de qué cosas pueden “molestar” a Google.

A veces un detalle que parece mínimo hace la diferencia entre aparecer o desaparecer de los resultados del buscador. Un servidor lento, una barra de más en el robots.txt o un mal manejo de la tecnología Flash son algunos ejemplos. Entérate cómo evitarlos.

El primer paso para chequear que tu sitio esté indexado de manera correcta es directamente entrar en Google y escribir site:www.nombredetusitio.com (¡con el nombre de dominio de tu sitio, obvio!).

De esta manera verás como resultado todas las páginas de tu sitio que están indexadas actualmente en Google.

¿Está tu sitio indexado en Google y otros buscadores?

Tal vez te enteres de que Google no ha indexado correctamente tu sitio, o que faltan páginas. La siguiente es una lista de probables razones y cómo solucionarlas:

  1. Problemas con el archivo robots.txt:
    No sé por qué se esparció tanto este error, probablemente porque mucha gente que no tiene mucha idea de cómo funciona el archivo robots.txt simplemente copió y pegó el código con error.
    La barra luego del comando “Disallow” hará que tu sitio NO SEA indexado por Google:
    User-agent: *
    Disallow: /
    Forma incorrecta.
    User-agent: *

    Disallow:
    Forma correcta (tu sitio será indexado).
  2. Un servidor lento:
    Tener un servidor lento no es un crimen para nadie más que para tí. Los spider-bots generalmente van en grupo, pero si Google detecta que podría consumir todos los recursos de tu sitio, simplemente no lo indexará por completo. Piensa que hay buenos servicios por muy poco dinero hoy en día, o redes sociales muy sólidas donde alojar tu sitio.
  3. Eres una fuente de spam:
    Bueno, Google sabe cómo detectar estas cosas. Y a nadie le gusta el spam, de modo que ¡te lo mereces! Pero si recapacitas, puedes “limpiar” tu sitio y enviar a Google una solicitud de reindexación. Google se fijará si has cambiado tu forma de actuar.
    Un dato importante: no quieras engañar a Google. Lo sabrá al instante y las consecuencias nunca son buenas.
  4. Sitio hecho en Flash:
    El tema de Flash es eterno, a mí también me agrada lo que se puede lograr con él, pero aún no es correctamente indexable. Si vas a diseñar tu sitio en Flash, asegúrate de dejar el texto como seleccionable (para alivio de tus usuarios) y monta la película en una página index “legible” por los spider-bots.
    Dentro de esta página deberías incluir todas las keywords que sean relevantes con el contenido de tu sitio, algún texto, enlaces, etc. Esto es prácticamente lo único que podrá indexar Google.
    Nota importante: parece que hasta ahora sólo se pueden indexar películas swf versión 7 para abajo. De la versión 8 en adelante no aparecerán en los buscadores por sí mismas.
  5. La “carrera de obstáculos” de los spiders:
    Muchas cosas hacen que los robots desistan o consideren que el contenido de tu sitio es irrelevante. Si el código Javascript que usaste ocupa las primeras 2000 líneas del código de tu sitio, si para entrar se necesitan cookies o alguna acción de los usuarios, si tiene URL dinámica y “poco amigable” o si tu sitio redirecciona varias veces antes de cargarse son algunos ejemplos.
  6. Tu sitio se “cae” frecuentemente:
    Si varias veces los robots han intentado indexar tu sitio y este no estaba disponible, dejarán de hacerlo. Esto también puede ser un problema del servidor. Puedes realizar una prueba desde el sitio Pingdom Tools para ver el estado de tu sitio, los tiempos de carga, etc.

Si tienes cuidado con estos detalles no tendrás problemas con la indexación. Recuerda que los spider-bots pueden ser muy útiles si los usamos a nuestro favor.

Fuente: Nerv

Enviar a Del.icio.us Enviar a Meneame Enviar a Digg Enviar a Fresqui Enviar a Enchilame

Comentarios (23)

  1. Yeah Positive dice:

    Estuve viendo en la parte HTML de mi blog y no encuentro ninguno de estos codigos: User-agent: *
    Disallow: / el otro tampoco. Sera por eso q no puedo aparecer en google, todos los sitios que aparecen cuando pongo site: http://www.yeahpositive.com es de cuando dejo firmas en otro blog o pagina pero no me aparece mi sitio. Realmente es algo que me preocupa mucho. Tengo un amigo que se creo un blog con el dominio http://www.rootsario.com.ar y el esta mejor posicionado siendo que empezo despues que yo y que casi no tiene contenido.

  2. Juan Manuel dice:

    ¡Hola, Yeah Positive!

    En tu comentario la extensión que pones es “.com” pero creo que quisiste poner “.com.ar”, fuera de eso…

    Estuve viendo el código de tu sitio y el problema es que el contenido no está en la dirección http://www.yeahpositive.com.ar sino en la “landing page” (de blogspot).

    También me fijé cómo está indexando Google tu sitio: velo por tí mismo haciendo clic aquí.

    Te darás cuenta cuál es la dirección que Google toma como “original”.

    En todo caso, para usar el comando “site:” deberías hacerlo con el nombre de dominio de blogspot. Cualquier otra duda me consultas ¿ok?

    ¡Mucha suerte y gracias por tu pregunta!

  3. Yeah! Positive dice:

    Gracias Juan Manuel, disculpa mi inutilidad pero no entendi mucho lo que me quisiste decir.

    Creo que los errores que tenia eran porque si bien tenia el dominio las direcciones siempre eran yeahpositive.blogspot.com/entrada ahora pude solucionar eso y las direcciones son yeahpositive.com.ar/entrada. Me costo mucho pero lo logre.

    Luego subi un sitemaps con Google Apps , lo hice de este manera http://www.yeahpositive.com.ar/rss.xml?redirect=false&start-index=1&max-results=400 para que me tome la mayor cantidad de post. Pero el problema que me surge es que me dice que todas las url estan restringidas por el robot.txt

    y este es el robot

    User-agent: Mediapartners-Google
    Disallow:

    User-agent: *
    Disallow: /search

    Sitemap: http://www.yeahpositive.com.ar/feeds/posts/default?orderby=updated

    Espero noser un pesado y gracias por toda la ayuda que me brindan

    URL restringida por robots.txtAyuda

  4. Juan Manuel dice:

    ¡Hola, Yeah Positive!

    En efecto, lo que te quise decir era lo de las direcciones en blogspot ^_^.
    Respecto de lo que estás poniendo ahora, dices que tu robots txt dice:
    “User-agent: *
    Disallow: /search”

    La barra (”/”) luego de disallow hace que tu sitio no sea indexado.

    Y ya que estamos, y perdona por preguntar pero ¿por qué estás usando un robots.txt personalizado en tu sitio? Me refiero a: ¿cumple alguna finalidad?

    Esto te lo pregunto sólo a fines de poder ayudarte mejor. Te mando muchos saludos, voy a tratar de ir a algún recital próximo o fiesta reggae que se anuncie en tu sitio :).

    ¡hasta la próxima!

    Juan Manuel

  5. Gloria dice:

    Hola Juan Manuel, llegue a tu sitio buscando algún lugar en Buenos Aires donde poder aprender manejar wordpress, y administrarlo en el hosting, ya que no entiendo ni jota d esto. Mi sitio pude empezar porque un amigo me lo instalo en el hosting. Asi que recien estoy aprendiendo algo.
    Queria preguntarte si es necesario crear esto del del robot txt, ya que es algo que no termino de comprender y para que sirve.

    Por cierto estuve leyendo tu blog a vuelo de pájaro y contiene muy interesante información

    Saludos

  6. Juan Manuel dice:

    ¡Hola, Gloria!

    No te recomiendo crear o modificar un archivo robots.txt, es sólo para fines avanzados de gestión del sitio respecto de los buscadores, por ejemplo, para indicarle al robot spider que no indexe tal o cual página, etc.

    Realmente hay que tenerla muy muy clara para meterse con eso (y aún así no te reportará ningún beneficio trascendente).

    Hay muchas notas aquí en elwebmaster.com sobre WordPress, espero que te sean útiles. ¡Bienvenida a nuestro sitio y no dudes en consultarnos por cualquier duda ^_^!

    ¡Saludos!

  7. Gloria dice:

    Muchas gracias Juan Manuel por tu pronta respuesta y a tu blog ya lo agende en mi lista de sitios a leer. Saludos desde Buenos Aires

  8. Maximiliano dice:

    Hola, esta bueno el foro, queria saber como hacer que mi sitio web sea compatible en distintas resoluciones, tanto en 1024*768 u 800*600, salu2

  9. Vero dice:

    Hola a mi me sal esto es k no se como quitarlo pero creo que por eso no indexa mi pagina a google
    User-agent: Mediapartners-Google
    Disallow:

    User-agent: *
    Disallow: /search

    Sitemap: http://sorpresasmorelia.blogspot.com/feeds/posts/default?orderby=updated

    mmm en realidad no se por que no indexa mi pagina
    ayudame!!!!

    Saludos!!

  10. Morton dice:

    Hola, Vero

    El comando “Disallow” sirve para impedir que las búsquedas realizadas en los buscadores puedan encontrar tu sitio. Para evitar que esto suceda, tal como explica la nota en el punto 1, elimina el texto “/search” que se encuentra luego de “Disallow:”.

    Si lo has hecho bien, tu código debería quedar así:

    ——————-
    User-agent: Mediapartners-Google
    Disallow:

    User-agent: *
    Disallow:
    ——————-

    Saludos!

  11. Vero dice:

    ok pero eso en donde lo modifico o en donde lo pongo,eso me sale en Acceso de rastreadores en probar robots.txt ,en que parte de mi codigo htlm lo pego o que ondas no se como resolver esto…..:(

  12. Vero dice:

    o si puedes pasame tu email creo que sera mas facil… por fis…en verdad necesito ayuda

  13. Luis Antonio dice:

    Hola amigos yo tambien comparto el problema de Vero con respecto a la indexacion de mi blog, y la verdad ya no se ni k hacer, quisiera saber como borrar ese “/search” para que indexe mi pagina:

    User-agent: Mediapartners-Google
    Disallow:

    User-agent: *
    Disallow: /search

    Sitemap: http://coroshema.blogspot.com/feeds/posts/default?orderby=updated


    de antemano muchas gracias.
    Luis Antonio
    Coro Shema.

  14. Morton dice:

    Hola, Vero

    Asumo que el blog al que te refieres es http://regalosadomiciliomorelia.blogspot.com/ ya que el otro que publicaste no funciona.

    Actualmente el sitio http://regalosadomiciliomorelia.blogspot.com/ se encuentra indexado por Google.

    Saludos!

  15. Morton dice:

    Hola, Luis Antonio

    Probablemente se deba a la configuración de tu blog en Blogger. Para cambiar la configuración, puedes hacerlo de esta manera:

    Para que Google indexe tu blog, simplemente ingresa a la configuración, en la pestaña de Opciones Básicas, y en la opción de “¿Deseas permitir que los motores de búsqueda encuentren tu blog?” coloca y luego guarda los cambios.

    En tu caso, el texto que encuentras en robots.txt es el predeterminado para un blog de Blogger y no puede ser reemplazado a excepción de que instales el blog en tu propio servidor. El código que posee tu robots.txt no impide la indexación, sólo evita que se indexen páginas duplicadas.

    Saludos!

  16. Vero dice:

    Gracias
    Morton!!!!!!!!!!!!!!!!!!!!!!!!!
    Muchas gracias!!!!!!!!!!!!!!!!!!!!

  17. kurt dice:

    el problema es que debes antes de publicarlo, incrustar los meta tags para que el buscador X lo encuentre, luego inscribe tu dominio en google y en cada buscador que se te ocurra…
    los meta tags son uy importantes pues contiene el codigo del robot araña y las palabras claves para encontrar tu contenido, espero que te sirva

  18. Cesar dice:

    Wow, por momentos los sigo lindo y por otros siento que me perdí. Cree dos blogs: http://www.diloconestilo.blogspot y http://www.lepasoamiamigo.blogspot, intenté darle de alta a ambos en diversos motores de búsqueda entre ellos Google. Ya “dilo con Estio” aparece encabezando la lista pero el http://www.lepasoamiamigo.blogspot.com no aparece. Ambos tienen Adsense y al chekar mi Estado de cuenta pude ver que éste último figura como que debo modificar el robot.txt No sé cómo hacerlo o dónde hacerlo.
    Me darías una mano con eso?

  19. Mauricio dice:

    Estimados amigos, hace poco que estoy trabajando en este sitio: http://www.clubdelasmascotas.cl pero lamentablemente aún no aparece en google y tampoco en ningún buscador…

    alguien me puede ayudar…???

    gracias

  20. Puzzle dice:

    Hola Juan Manuel, enhorabuena por tu site.. Ayudan de tanto!!
    Te explico mi caso a ver en que podrias ayudarme.. Es referente a todo esto.. Seria casi el mismo problema que tuvo “Luis Antonio” y “Vero” Tengo un blogger y me dice los de disallow: /search
    Tu dices que es predeterminado y no puede cambiarse.. La cuestion es que tengo 2 bloggers indexados!! pero siento que las entradas como tal NO.. y me duele mucho las pelotas por eso =(
    el primer blog no me tira ningun url restringida por url.. pero EL SEGUNDO me tira 6!! vamos casi todas las entradas.. Lo que me doy cuenta tambien es que las entradas que me restringe no van a ningun sitio no tiran error 404 PERO son con extension “/search/label/blogspot” por ejemplo.. Y la verdad NOSE. si eso tenga algo que ver.. Soy un novatillo en blogger.. Y la verdad me siento como cucaracha en baile de gallina.. Si me podrias ayudar o mostrar la luz te estaria MUY agradecido..
    Thanks de ante mano y gratz..
    Sin animo de hacer spam, te dejo link hacia mis 2 blogs para que des un vistazo o los examines por google =)
    http://puzzlerules.blogspot.com/
    http://trucos-ganar-dinero.blogspot.com/

  21. Puzzle dice:

    OHH se me olvidaba.. Por otro lado uno de los blogs al meterme en herrramientas de webmaster por google me dice “url que se han indexado” y me muestra TODAS.. Sin embargo el otro me dice que solo una!! y eso me preocupa muchoo.. MUCHO.. A ver si tu experiencia puede iluminarme ;)
    Y disculpa la tocadera de naricez >.<

  22. spontter09 dice:

    Hola!!.. les cuento que mi blog tampoco es visitado porque tampoco está en google. Quisiera saber cuanto se demora en que aparezca en google??…ya lo indexé o registré en google pero no me aparece.
    Visiten mi blog.
    Si alguien quiere que hagamos intercambio de links de las paginas, yo feliz. Mande mensaje privado a daniloveclo@gmail.com
    Saludos!!

  23. spontter09 dice:

    olvidé poner mi Blog para que lo visiten:
    http://lasmejoresptcdelared.blogspot.com/
    Saludo2!!

Deja tu opinión

© 2007 - 2008 elWebmaster.com | Powered by Wordpress | Diseño CSS y XHTML válido. | Algunos íconos basados en FamFamFam Mini
Iniciar sesión