Juan Manuel 16 de enero de 2008 a las 13.28
   Imprimir artículo
elWebmaster.com

Domina los spider-robots de los buscadores con meta comandos


Los motores de búsqueda usan robots o spiders para indexar los sitios web. Hay varias formas de modificar su comportamiento, generando un archivo robots.txt, como hablamos en algún momento. También sabemos que hay tecnologías que no funcionan bien con los spiders (Flash, Javascript, etc.), que hay que tener en cuenta si queremos que el sitio se posicione alto. Sin embargo, el uso de meta comandos para robots en cada una de las páginas de nuestro sitio puede hacer que los robots trabajen a favor nuesto.

Los “Spider Commands” más usados

<meta name=”robots” content=”index” />

Este comando es uno de los más usados y uno de los menos necesarios. La función del robot es indexar tu sitio, salvo que le indiques que no lo haga. El comando “index” es como si dijeras “Hola, robot, si quieres indexar mi sitio, adelante”. Está de más ya que el sitio se indexará de todas formas.

<meta name=”robots” content=”follow” />

Este comando es igual que el anterior. Le indica al robot que “siga” los links que hay en esa página, pero de nuevo es una función que el robot hará sin que se lo pidan.

<meta name=”robots” content=”noindex” />

Este sí es útil. Indica a un robot que NO indexe la página. Pero hay que tener en cuenta que sí seguirá los links que haya en ella.

Algo muy importante: hace alrededor de un mes publicamos una nota sobre la penalización de Google a quienes usen este comando para fines ilegítimos. Esto se debe a que “noindex” puede usarse para que una página no sea indexada ni vista por el público, pero que sí que se indexen un montón de links irrelevantes dentro de ella con el objetivo de subir el PageRank del sitio. Esto no es para nada recomendable.

Pero un buen uso de este comando sería si tienes un sitio con una versión dinámica y otra en HTML normal, agregar “noindex” a las páginas dinámicas para evitar confusiones y caída del PageRank por error, al pensar que estás duplicando contenido.

<meta name=”robots” content=”nofollow” />

Es para que los robots no indexen los links. ¿Te viste obligado a poner un link por cortesía pero la página destino deja mucho que desear? Puedes usar este truco para que tu PageRank no baje.

<meta name=”robots” content=”noindex,nofollow” />

Esta es un arma poderosa. Mantiene a los robots a raya. “No leas esta página. No mires los links. No la indexes”. Hace que tu página sea invisible a todos los buscadores.

<meta name=”robots” content=”noarchive” />

Todos los buscadores ofrecen versiones de los sitios que fueron almacenadas en el caché (cache version), que los usuarios pueden ver como si se tratara de una instantánea del sitio en el pasado. ¿Pero qué pasa con sitios que venden productos o servicios? Si los precios subieron y un usuario ve los precios anteriores no se llevará una buena impresión. Este comando les dice a los robots: “No guardes un archivo de esta página, habrá cambios frecuentes en ella”.

Hay mucho otros comandos, algunos no convenidos por todos los motores de búsqueda, pero estos funcionan universalmente y nos ayudarán a darle un empujón en el PageRank a nuestro sitio. Cuéntanos qué comandos usas tú y cómo te funcionan. ¡Esperamos tus comentarios!

Fuente: SiteProNews


Enviar a Del.icio.us Enviar a Meneame Enviar a Digg Enviar a Fresqui Enviar a Enchilame

Comentarios (4)

  1. david guerra dice:

    muy bueno por los buscadores, muy bueno.

  2. Califa dice:

    Excelente resumen, gracias por compartirlos…. saludos desde COLOMBIA

  3. Ricardo Roa dice:

    Hola webmaster, muy interesante su articulo sobre los spider commands más usados pero le agradecería enormemente que me explicara como se incluyen estos comandos en un blog.

    gracias por su colaboración.

  4. julio dice:

    Realmente muy completo tu articulo aunque en blogspot no tengo muchos problemas.

Deja tu opinión

© 2007 - 2008 elWebmaster.com | Powered by Wordpress | Diseño CSS y XHTML válido. | Algunos íconos basados en FamFamFam Mini
Acceder