Contenido duplicado y Google
Páginas y hasta sitios enteros han sido duplicados para mejorar sus posiciones en Google, aumentando el tamaño de sus webs y la cantidad de palabras clave por las que compiten.
Páginas y hasta sitios enteros han sido duplicados
para mejorar sus posiciones en Google, aumentando el tamaño de sus
webs, la cantidad de palabras clave por las que compiten y acaparando en ocasiones
todos los puestos de la primera página de resultados. Hasta ahora.
En las últimas semanas se han observado muchos
webmasters quejarse de que sus posiciones, por las cuales habían trabajado
tanto en obtener, habían desaparecido completamente. Además,
notaron que fijándose si las páginas estaban indexadas por Google
(buscando site:www.midominio.com)
las mismas aparecían, pero sin título ni descripción.
Luego de mucha discusión se encontró
que muchos de esos sitios webs, aparentemente penalizados, tenían páginas
duplicadas, secciones completas duplicadas o hasta eran webs duplicadas de
otra web original. Ese era el factor común entre todas ellas.
Empecemos por tratar de entender qué es una
página o una web duplicada. En términos poco científicos,
una página duplicada es aquella que ha sido copiada (o es muy similar)
a otra, la cual puede ser accedida desde una URL distinta.
Ahora, veamos las razones por las cuales nuestro sitio
web podría ser filtrado:
-
Nuestra web entera es una copia
de otra web (tanto si es de tu pertenencia como no). Esto puede conllevar
la penalización de nuestra web entera. -
Una sección entera (con un
alto número de páginas en comparación del total de
la web) es una copia de otra web (tanto si es de tu pertenencia como no).
Esto puede conllevar la penalización de nuestra web entera o de esa
sección en particular. - Una página es una copia de otra página
de otra web (tanto si es de tu pertenencia como no). Esto puede conllevar
la penalización de esa página en particular.
Hay que agregar que se ha observado que un factor para
potenciar las posibilidades de que Google note la duplicidad es que las páginas
similares en cuestión se encuentren alojadas bajo la misma IP.
Pero… ¿cómo sabe Google qué
páginas son duplicadas? ¿Cómo sabe qué página
es la original para penalizar la duplicada?
Las respuestas están dadas en la patente que
registró en diciembre de 2003, lo que también nos muestra que
esto estaba planificado hace ya unos meses. La misma puede ser leída
aquí:
http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1…
(en inglés).
h
Si no cuentas con el tiempo, te resumimos este extenso
texto en que Google selecciona porciones de texto de las páginas webs
y les asigna una "huella digital".
Si otra página tiene esas mismas huellas digitales, entonces esa será
la copia. Esto destaca también que la web considerada como original
sería la primera indexada por Google.
Caso de estudio:
Lamentablemente, un cliente de SEOHome
sufrió este filtro. Él pensó que agregar una sección
de otra web que posee, en la web que fue luego penalizada por esto, sería
útil para sus usuarios, sin consultarnos sobre los métodos para
prevenir posibles filtros como este. El resultado fue la penalización
de toda su web, a excepción de su página principal. Asustado,
nos contactó para preguntarnos sobre su situación y, felizmente,
ya lo habíamos notado y preparado una posible solución. Al ser
una sección que no tenía utilidad alguna para el posicionamiento
de la web y sólo era útil para los usuarios, cambiamos los links
para acceder a la misma a un formato en javascript, puedes crear uno así:
<a href=\"javascript:location.href=\’http://www.midominio.com\’\">Texto</a>
para que Google no los siga y eventualmente elimine esas páginas conflictivas
de su listado. Apenas dos días después de esto, esas páginas
duplicadas fueron eliminadas de Google y las páginas con contenido
único que también habían sido afectadas volvieron a aparecer
normalmente.
Recomendaciones finales:
-
Si no es absolutamente imprescindible,
evita duplicar contenido de otra web. -
Si lo haces, cambia su contenido
lo mayormente posible para evitar ser considerado duplicado. -
También te recomendamos
alojarlo bajo una IP distinta. -
Si caes en el filtro, aísla
esas páginas para que no sean indexables, como comentamos en el caso
de estudio.
Por último, te recomendamos esta herramienta
para chequear el porcentaje de similitud entre dos páginas:
http://www.webconfs.com/similar-page-checker.php.
Aunque no es demasiado precisa, te recomendamos mantener un valor de similitud
por debajo del 50%.
Lo que no me queda muy claro es la forma como Google maneja sitios con varias extensiones de dominio pero que redireccionan al mismo contenido?
ES LA MANERA MAS DESONESTA DE LA INTELIGENCIA.EL HOMBRE SE HA SUPERADO POR IR INNOVANDO, CREANDO.
MUY INTERESANTE
Hola Christian. Yo tenia la misma duda, estuve leyendo ayer algo al respecto. Lamentablemente no guardé la dirección, pero si lo veo de nuevo regreso aqui y la comparto. Lo que está haciendo el algoritmo es calculando una “firma digital” para cada página que indexa. (supongo que algo al estilo md5, aunque el artículo no era explicito en esto o en que elementos toma en cuenta para calcular la firma) Luego, si aparece otra página con la misma firma digital, considera que es contenido duplicado y penaliza a la segunda.
La idea es esa…
Hasta luego.
😉
Genial. Gracias por la información.
La duda seria ahora… y si google usa ese algoritmo… ¿como sabe cual es la pagina original y cual la copia? :S
Pues en realidad no lo sabe. Lo que se sabe es que la primera pagina indexada se considera “original”, y todas las que resulten duplicadas con esta serán penalizadas, al ser consideradas “copias”.
Esl algo arbitrario… pero quien le dice que no a Google?
lo que no entiendo es como canijos podemos revertir la penalizacion, mi sitio web fue penalizado y hasta ahora no encuentro la forma de reindexarla, es necesario comprar otro dominio o que?
todavia penalizan?
Bueno… lo primero es que dejes tu mala práctica. Luego, podes enviar un mail a [email protected]. Nada garantiza que te respondan.
Luego, para recuperar tu PR, debes esperar al proximo Google Dance. El asunto tomará tiempo… si tenes suerte en unas 4 o 5 semanas podes estar indexado de nuevo.
Lo siento… realmente elegiste una mala práctica, y ahora te toca esperar…
Hasta luego.
😉
bacano
HOLA AMIGOS..
Que sucede en el caso que tenga una sola pagina web y ya haya sido indexada en el GOOGLE, y luego registro un nuevo dominio y lo redirecciono,, el segundo dominio sufre las causas del FILTRO? o para estos casos no se aplica…
Expliquenme por favor. GRACIAS
[email protected]
oye no c como borrar el contenido de google c graba todo lo q escribo ahi porfa mandame un mail de como hacerlo es [email protected] gracias chauuu
Saludos,
Lo primero que debes hacer es restringir las carpetas donde esta ese contenido mediante el robots.txt que google analiza seria algo asi:
User-agent: *
Allow: /
User-agent: Googlebot
Disallow: /Carpeta_con_el_contenido
Eso lo realizas mediante la administración del Sitemap de Google..
Att. minegociodr.com
República Dominicana
hola soy omar quien me puede decir como borrar todo lo que se filtra en google en la bandeja de entrada por que todo se graba y no pueod borrarlo
hola amigos como puedo hacer para borrar eso de lo que les dije mi correo es [email protected] ayudenme porfabor se los suplico mandenme su respuesta espero
necesito como borrar la paginas de google por que quedanron marcadas
También utilizar etiquetas nofollow en el HTML
He utilizado la herramienta para ver la similitus entre dos paginas de noticias distintas de mi web y me da una similitud del 31% ¿ es peligroso este nivel? . Las similitudes se deben a que todas las paginas de noticias tienen textos comunes, como por ejemplo las notas de prensa y otros textos que salen de forma automatica en cada noticia nueva que se escribe.
¿Pero como saben cuál es la original? ¿Se puede dar el caso de que penalicen a la que no es? y ¿tiene remedio, si se han equivocado?
como puedes borrar lo que se granba en google
por que cuando escribo algo y entro en la pag despues lo vuelbo a escribir na damas las primeras letras y se pone lo que iva a escribir
Yo tengo una pregunta clave: Tengo un foro y un blog, las noticias importantes que se publican en el foro las coloco en el blog. ¿Se penalizaría esto? Gracias anticipadas por las respuestas.
Muy buen articulo..!!!!!!