Thursday, March 22, 2012

Sucedió que Joost nos envió el mensaje

0:07
Hola a todos. Bienvenido a otro vídeo. Hacemos esto cuando hablamos conferencias y hablamos de algo
0:12
importante, no sólo preguntas y respuestas, daremos un vistazo a nuestra presentación más tarde,
0:17
y la pondremos aquí para que la gente pueda seguirla, vea las diapositivas y con suerte aprenda algo nuevo.
0:21
Así que hoy quería hablar sobre el elemento enlace canónico. Algo que Google, Yahoo, y Microsoft
0:28
anunciaron que apoyarían durante el SMX West. La fecha en la que se anunció fue
0:37
el 12 de febrero de 2009, y una cosa curiosa es que Charles Darwin nació exactamente hace 200 años ese mismo día.
0:45
Así que empecé la presentación con una broma en la que decía que si creías que la web fue inteligentemente diseñada
0:50
por Tim Berners-Lee, o si creías que la web tiene que evolucionar, pero da lo mismo ya que es un estándar abierto
0:57
que ayuda a que la gente la mejore. Así que nos preguntamos, ¿qué tipo de problemas tiene hoy en día la gente,
1:05
webmasters, SEO y dueños de sitios web? Está bastante claro que el contenido duplicado es una de las cosas que
1:11
más preocupa. Entonces, ¿qué es contenido duplicado? Bueno, tengo aquí una diapositiva donde muestro ocho
1:18
URL diferentes, sabes que cada una de estas direcciones podría devolver un contenido completamente diferente.
1:26
Como humanos cuando miramos a www.example.com o a example.com / o a /index o a home.asp, pensamos en ellas como
1:34
la misma página. En práctica, suele ser la misma página. Y técnicamente no tiene que ser, pero casi siempre
1:41
los servidores web devolverán el mismo contenido para estas ocho diferentes versiones de la URL.
1:46
Esto puede causar muchos problemas a los motores de búsqueda, si en lugar de tener tus enlaces hacia una página,
1:53
están divididos entre la versión con www y la sin www. Y esto da muchos dolores de cabeza. ¿Cómo resolver esto?
1:59
¿Cómo solucionarlo? Bueno, pues resulta, y voy a detenerme en esta diapositiva unos minutos, hay muchas
2:05
formas de arreglarlo. Algunas personas han bromeado sobre este elemento enlace canónico que es como
2:11
masilla que arregla el aspecto de las grietas de una pared. El hecho es que hay un montón de
2:17
maneras de arreglar de antemano las cosas, así no hay necesidad de que las arregles a posteriori.
2:23
Hubo una cita muy graciosa en la conferencia de Jill Whalen, en la que dijo,
2:29
"Los desarrolladores son los que dan trabajo a los SEO"
2:31
Así que, tanto si eres desarollador como SEO, hay algunas buenas prácticas que pueden hacer las cosas un poco
2:36
más fáciles para tu sistema de modo que no tengas que preocuparte por el contenido duplicado.
2:41
Una es tratar de asegurarse de que tus URL están estandarizadas, Microsoft a veces las llama normalizadas,
2:48
en esencia, sólo hay una forma de llegar al contenido. Si tu sistema de gestión de contenidos genera siempre URL
2:55
coherentes, completamente uniformes y sin que tengas que preocuparte por tener ocho versiones diferentes,
3:00
esto te ahorrará un montón de problemas. No tienes que preocuparte de que esto te pase.
3:05
Una forma de evitarlo es arreglar tu sistema de gestión de contenidos o software para que sólo genere estas URL
3:11
de forma consistente. Otra cosa es pensar en tu sitio. Supongamos que tienes www.example.com y
3:19
la versión example.com, y a veces enlazas a la versión www y otras a la versión sin www, es natural que
3:26
los motores de búsqueda se líen un poco. Así que, enlazar consistentemente, diciendo, mi página de inicio es
3:33
www.example.com/. Nada más. Y, a continuación, asegurarse de que todos los enlaces internos son coherentes
3:40
puede marcar una gran diferencia, de manera que no termines con dos, tres o cuatro copias de cada página.
3:45
Si tienes, home.asp o index.html, puedes reescribirlas de tal manera que todos las demás URL sean redirecciones 301
3:56
a una única URL. Por lo tanto, es genial que puedas arreglarlo desde el principio y enlazarlo siempre igual así
4:02
este problema nunca ocurrirá, pero si se duplican URL, entonces puedes utilizar una redirección permanente 301,
4:09
una forma de estandarizar y agrupar todas estas URL. Los motores de búsqueda seguirán ese redireccionamiento 301,
4:15
y generalmente las agruparán. Google además hace un par de cosas más que otros motores de búsqueda no hacen.
4:21
Así pues, en nuestras Herramientas para webmasters, nuestra consola, totalmente gratuita, no cuesta nada,
4:28
puedes especificar, por ejemplo, mi sitio es mattcutts.com, qué versión prefieres si www.mattcutts.com o sin www,
4:36
sólo mattcutts.com. Esa es una configuración muy sencilla, y evita un montón de contenido duplicado.
4:42
Y un hecho poco conocido, no todo el mundo se da cuenta de esto, es que cada vez que envías tu URL a través
4:48
de un sitemap, otro estándar respaldado por la mayoría de los principales motores de búsqueda, que es un simple
4:53
archivo, tan sencillo como una lista de URL, cogemos esa lista de URL que has enviado y nos decimos,
5:00
"si vemos una URL en esa lista y, a continuación vemos otra versión de ésta que no está en la lista, preferiremos
5:06
las URL que están en tu lista. Así que solemos utilizarlo para atar cabos cada vez que envías URL en un sitemap.
5:12
Así que hay al menos un par de formas de darle pistas a Google que pueden ayudar con el contenido duplicado.
5:18
Pero, dicho esto, seguramente siempre habrá problemas de contenido duplicado que no podrás arreglar tu mismo.
5:26
Veamos algún ejemplo. A veces, no puedes generar una 301 permanente. Por ejemplo, en mi antigua cuenta del colegio,
5:33
cs.unc.edu, yo no controlo el servidor web. Así que tendré que abrir una incidencia o enviarles un email a los
5:39
administradores y decir "¿podéis añadir un 301 desde esta página a esa otra?" En muchos servidores gratuitos
5:45
no podrás generar un redireccionamiento 301. Tampoco podrás evitar cómo la gente enlaza a tu web. Por ejemplo,
5:52
sabes que incluso si enlazas consistentemente a la versión con www. de tu sitio web, el resto podría enlazar a
5:59
la versión sin www. Y realmente tú no puedes controlar esto.
6:03
Rutas con mayúsculas o con minúsculas. MS IIS muestra las páginas tanto si enlazan a la home.asp en mayúsculas
6:13
o en minúsculas, y a veces incluso en casos mezclados. Si la gente enlaza a las diferentes versiones en mayúscula y
6:19
minúsculas mezcladas, esto puede causar problemas. La ID de sesión es otro factor importante. Así que he visto,
6:26
al menos en algunos motores de búsqueda, un sitio con una página de Política de privacidad indexada
6:33
tres mil veces, cada vez con una ID de sesión diferente, porque la página era ligeramente diferente cada vez.
6:41
Así que ya sabes, en general, si puedes evitar la ID de sesión, mejor. Pero a veces, como
6:47
optimizador para motores de búsqueda o encargado del sitio web, no te puedes deshacer de estas por completo.
6:52
Códigos de seguimiento, si compras anuncios. Analytics, el parámetro UTM, las páginas de inicio cuando tienen que
6:58
ser diferentes para los diferentes anuncios. Estas son el tipo de cosas de las que a veces no te puedes deshacer.
7:04
Si diriges una tienda online, digamos con diferentes productos, puede que haya que ordenarlos por precio más bajo
7:10
o por el más alto y a veces es necesario que tengas diferentes facetas o puntos de vista de tus datos, y
7:16
conceptualmente es la misma cosa, se trata simplemente de diferentes formas de organizarlos.
7:21
Por último, rutas de navegación. Son como yo llegué a esta página. ¿Llego a esta tienda de campaña roja
7:28
a través de tiendas de campaña o a través de los colores? ¿o llegué porque estaba interesado en accesorios?
7:34
¿Cómo llegué? Incluso la documentación de ayuda para webmasters de Google a veces tiene un parámetro CTX que dice
7:41
aquí es como llegamos a esta página. Y ese día, fue gracioso, la Reina acababa de lanzar un nuevo sitio web:
7:50
royal.gov.uk. Yo le deseo lo mejor a la Reina, que viva muchos años y le deseo lo mejor a la monarquía británica,
7:59
Sin embargo, alguien en el Telegraph, telegraph.co.uk, hizo una auditoría SEO del sitio web y encontró
8:07
el tema del contenido duplicado. Aquí ves, sólo con barra, royal.gov.uk/Home.aspx y luego en la parte inferior
8:15
yo hice una nota de rescate, mayúsculas y minúsculas mezcladas, y el real sitio web devolvió la misma página
8:23
para cada una de estas URL. Era sólo un ejemplo muy simple para demostrar que cualquiera puede tener este
8:29
tipo de problemas.
8:31
Entonces, ¿cuál es la respuesta? ¿cómo resolvemos este problema en particular?
8:37
Asumiendo que no puedes resolverlo de ninguna otra manera, y de verdad animo a intentar arreglarlo por adelantado,
8:42
trata de enlazar consistentemente. Con esto no podrás decir "ah, ahora todos mis problemas están resueltos,
8:47
no tengo que preocuparme de nada más". Pero, si no puedes resolver tus problemas de otra manera, hay un
8:52
elemento muy sencillo, un elemento de enlace, donde puedes señalar tu canónica, y eso es como decir mi preferida,
9:00
o la primaria, o la definida, la versión bonita de la URL que yo deseo utilizar, y no esa fea URL con un código de
9:07
seguimiento o sesión ID, es esta bonita URL. Y todo lo que tienes que hacer es decir en el elemento head de este
9:14
documento, incluso aunque tenga una sesión extraña, que la bonita versión, que la versión canónica de
9:20
esta dirección URL, esta aquí. Y eso es todo lo que es. Es un estándar abierto muy simple. Un simple elemento
9:28
que se añade en el head de tu documento.
9:31
Algunas cosas interesantes. Esta es la versión del director así puedes tener más de información. ¿Es una etiqueta?
9:38
Es como una etiqueta, su nombre técnico creo que es "elemento". Pero aquí todos somos amigos y nadie se va a meter
9:45
contigo o burlarse de ti si le llamas etiqueta de enlace canónico o elemento enlace canónico. La gente a menudo
9:52
habla de meta etiquetas ¿verdad? Y las meta etiquetas son cosas que van también en el head del documento. Y así, si
9:59
una meta etiqueta tiene un valor que es un hiperenlace, creo que lo más correcto es que no sea un meta, sino que
10:05
se llame "enlace". Y es eso por lo que ves link rel="canonical" href= y el valor. Así que ahora ya sabes el nombre
10:12
oficial, pero a nadie le va a importar si le llamas etiqueta de enlace canónico.
10:18
Una cosa que es interesante sobre esta etiqueta, vamos a hablar solo de algunas cosas más relevantes.
10:25
No prometemos acatar esto al 100%. ¿Vale? Si vemos que un webmaster y ellos se han disparado accidentalmente
10:31
en el pie, ya sabes quizás hayan creado un bucle infinito, y es muy fácil crear uno,
10:37
nos reservamos el derecho de hacer lo que creamos que sea mejor. Al menos en Google, vamos a tratar esto como una
10:42
pista. Así que a menos que veamos algún caso excepcional o algo que perjudica tu propio sitio, probablemente sería
10:49
de esperar que respetemos la etiqueta. Así que en la mayoría de casos, funcionará bastante bien. Aunque nos tenemos
10:56
que reservar el derecho como caso final el decir que no, cuando no creamos que eso sea lo mejor para los usuarios.
11:03
Pero es mucho mejor si lo puede solucionar uno mismo. Así que echa un vistazo a las otras alternativas
11:09
antes de usar esta etiqueta. No pienses "le planto una etiqueta de enlace canónico y
11:14
ya está, ya he acabado".
11:17
Si eres un usuario con un pequeño negocio, y usas WordPress o cualquier software para carrito de compra,
11:24
puede que no sea lo mejor ponerte manos a la obra para arreglarlo tu solo,
11:30
por lo menos por ahora. Espera, porque creo que saldrán plugins, la gente incluso está hablando de si
11:36
WordPress lo añadirá al software base, así que puede que ni siquiera necesites el plugin. Así que si eres
11:41
uno de estos usuarios y esperas unos meses, todo debería ir bien. Es algo nuevo, así que tienes tiempo
11:47
para pararte a pensar y decir, vale, ¿qué tipos de contenido duplicado tengo y cómo puedo arreglarlo?
11:55
Tómate tu tiempo. No empieces directo "oh, apuntaré a todo el mundo, lo haré todo".
12:00
Tienes tiempo hasta que se dé respaldo a esto, así que puedes planear con tiempo.
12:05
Y como siempre, si vemos que se abusa, nos reservamos el derecho de cambiar el tratamiento que damos a la etiqueta
12:11
o no respetarla. Hay una buena manera de evitar el abuso. Permitimos cosas dentro del mismo dominio,
12:20
pero no las permitimos entre dominios. Con las 301 siempre ha habido esta noción de ¿me puedo apropiar de un sitio
12:27
con 301 raras, puedo robar la reputación de otro sitio? Y por lo menos ahora, este elemento no está
12:34
sujeto a eso, ya que sólo se puede usar dentro del mismo dominio. Una pregunta normal después de esto es,
12:41
¿qué pasa con los subdominios? ¿Puedo hacer cosas entre diferentes nombres de host?
12:45
Y la respuesta es sí que puedes. Estaba hablando con Tony Hsieh de Zappos, sobre contenido duplicado.
12:51
Tienen un servidor llamado zeta.zappos.com, que es un software de prueba y puede que sea la
12:56
próxima versión. Y me decían, ¿puedo enviar mi canónica, puedo pasarla de zeta.zappos.com a
13:03
www.zappos.com? Y la respuesta es que claro que puedes.
13:08
¿Se puede usar para enviarlo de https a http? Claro, va muy bien. Está en el mismo dominio, así que no es
13:16
un problema en absoluto, al menos en Google, el utilizarlo con ese fin.
13:19
Entonces ¿cuál es la diferencia entre esto y una 301 o redirección permanente? No hay mucha,
13:26
salvo que se limita a un solo dominio. Las 301 son posibles entre dominios, y esto es dentro del mismo dominio.
13:33
De hecho, el modelo mental que tengo de esto es que es básicamente como una mini
13:40
redirección 301 que puedes generar con este elemento de enlace. Así que, si piensas cómo Google trata las 301,
13:48
probablemente esta esa una buena suposición sobre cómo vamos a manejar este elemento.
13:54
Bueno, unas pocas preguntas más, ya que tienes tiempo y estás viendo el vídeo. ¿Deben las páginas ser idénticas?
14:01
Exactamente idénticas, no. Piensa de nuevo en el caso del catálogo, en el puedes ordenar la página por
14:08
precio ascendiente o decreciente, conceptualmente son casi la misma página. Así que si quieres
14:14
agruparla a la misma URL, y no preocuparte por el parámetro, claro que puedes hacerlo.
14:22
Deben ser parecidas. Esta situación es la única que se me ocurre donde podría haber abuso, digamos que
14:26
tienes una página de dibujos, y luego algo sin ninguna relación con los dibujos
14:31
y los intentas combinar a la vez. Y en realidad no estás ganando ventaja, ya que tenías PageRank
14:36
en las dos páginas. Así que no tiene sentido combinarlas, pero recomendamos que lo hagas con
14:42
páginas similares. No tienen que ser idénticas, tan sólo similares.
14:46
Más cosas. ¿Qué hay de las URL relativas contra las URL absolutas? Pues puedes usar las dos.
14:55
Recomendamos URL absolutas. Y hay una razón muy sencilla. Cuando tienes URL relativas, puedes mover una URL y
15:02
todo sigue igual con respecto a esa URL. Por lo tanto, la página principal puede decir "/images" o "images".
15:10
Y que se mueve en relación a esa página. Pero es mejor una URL absoluta porque se trata de
15:17
una herramienta potente, y te interesa especificar que ésa URL va exactamente a ésta URL.
15:23
Si es relativa y te equivocas ahí, te equivocarás en algún otro sitio más también.
15:28
¿Podemos seguir una cadena de etiquetas o elementos canónicos, como se sigue una cadena de redirecciones 301?
15:35
Sí, pero de nuevo, no lo recomiendo, porque si tienes un sitio grande con una cadena de redirecciones 301,
15:41
es fácil que algo se rompa. Es algo parecido, y no quieres sufrir las consecuencias,
15:47
así que recomiendo URL absolutas, y pasar de la antigua URL a la nueva URL, un salto
15:55
y eso es todo. Es más fácil de esta manera, y quieres ir a lo seguro. No quieres
16:01
dispararte al pie sin querer. ¿Y cómo podrías dispararte al pie accidentalmente? Pues por ejemplo si dices mi
16:07
canónica está aquí y ¿es eso una página 404? Cierto, puede que la página no exista. ¿Y qué pasa si tienes un
16:13
bucle infinito? Esto es canónico. No, ésto es canónico. Y todos hemos visto que eso ocurre, ya sabes, ¿qué es
16:18
guerra civil? Busca guerra entre estados. ¿Y qué es la guerra entre estados? Busca guerra civil.
16:23
Y tienes que dejar el diccionario, con un dolor de cabeza. Por eso, intenta evitar los bucles infinitos.
16:28
¿Qué pasa si apunto a una URL que no se ha rastreado? Intentaremos rastrearla, pero podría ocurrir algo excepcional,
16:34
¿y si digo en la consola para webmasters "oh sí, todo debe ser www.example.com, pero luego especifico los
16:42
canónicos sin "www"? Así que puedes hacer todo este tipo de cosas que son casi como dispararse uno mismo al pie,
16:48
y la respuesta es que trataremos estos casos excepcionales de la manera más razonable. La presentación tiene
16:54
Cazafantasmas, porque como ellos decían ¡No cruces los rayos! Así que piénsatelo y tomáte tu tiempo 00:17:00.810,00:17:06.090 no pongas las etiquetas canónicas de cualquier modo en tu sitio, ya sabes, planifícalo un poco para
17:06
evitar estas situaciones raras.
17:09
Estamos llegando al final de la presentación. Quería saludar a Joachim, que es
17:14
el ingeniero de Google que ha implementado esto y ha hecho todo el trabajo duro. Se aseguraró de que funcionaba
17:19
bien dentro de una 301 y pensó en todos estos casos excepcionales. Por ejemplo, alguien dijo, ¿y si
17:25
tengo un canónico que apunta a mí mismo? ¿Funciona eso? En efecto. ¿Y si tengo un canónico y mi
17:31
href está vacío? Entonces da un error, que hace que apunte a sí mismo. Así que todo esto
17:38
funciona porque Joachim hizo un buen diseño, pero de nuevo, asegúrate de que tienes URL absolutas y de que todo
17:44
está bien especificado. También me gustaría saludar a Greg Grothaus. Resulta que cuando investigas en esto,
17:51
un montón de gente había propuesto ideas similares. Vi por lo menos una entrada en la web después de empezar a
17:59
explorar esto diciendo, "hey, ¿porqué no hacéis algo así?". Pero fue Greg uno de los que comenzaron
18:05
a discutir el tema en Google, apostó fuerte por esto y tuvo una gran idea, así que pienso en él como,
18:11
al menos dentro de Google, quien empezó a mover el trabajo sobre este tema y lo aprecio.
18:17
Y, por supuesto, toda la gente, de Maile a Wysz pasando por Adam y Riona, que han trabajado
18:23
para que el mensaje llegue a diferentes personas. En Yahoo!, Priyank, y mucha gente de Microsoft,
18:30
Nathan Buggia y muchas otras personas también. Espero que muchos motores de búsqueda lo respalden.
18:35
Yahoo! y Microsoft han anunciado que lo respaldarán, crucemos los dedos por Ask, me encantaría que
18:41
participaran también. Wikia, Artur de Wikia, nos había enviado un email preguntando sobre las etiquetas canónicas.
18:49
Y fue genial que pudieran ponerlo a prueba mientras nosotros mismos estábamos probándolo.
18:54
Y luego un montón de webmasters que siempre nos envían sus comentarios sobre lo que les gustaría ver.
18:59
Por último enumero un montón de recursos, sobre los que tanto Google, Yahoo como Microsoft escribieron algo.
19:06
Hay una página oficial de documentación en el Centro de Asistencia. Y veíamos que la gente tenía preguntas sobre
19:13
contenido duplicado, cuando Joost vino a preguntarnos sobre un caso interesante; así que dijimos, ¿sabes qué?
19:19
Tenemos esto que va a salir y que podría ayudar. Y eso fue una muy buena manera de hacer como un
19:23
beta test tranquilo y vimos cómo funcionaba. Sucedió que Joost nos envió el mensaje unos días antes de que
19:30
anunciáramos nuestro respaldo al elemento, así que le dimos un preaviso de posible apoyo, y volvió con
19:35
plugins no sólo para WordPress, también para Magento, un software de comercio electrónico, y para Drupal,
19:41
otro CMS de código abierto, que creo que hasta la Casa Blanca usa.
19:46
Así que realmente apreciamos el trabajo que ha hecho tan bien. Y, en general, ya sabes, ten cuidado, sé prudente,
19:54
planifica cómo quieres usarla. No tenemos la intención de sacar dinero de esto, sólo que es bueno para la web,
19:59
da lugar a menos contenido duplicado. Es un estándar abierto, cualquier motor de búsqueda que rastrea la web
20:06
puede usar la información para hacer la web más relevante y aumentar la relevancia de sus resultados de búsqueda.
20:09
Y ahora ya sabes tanto como los que asistieron a la conferencia del SMX West.
20:14
Muchas gracias por tu atención, hablamos pronto.

No comments:

Post a Comment