Conteúdo duplicado: o que é, mitos e soluções
5 (100%) 3 votos

Nós que estamos constantemente antenados com regras de SEO e desejamos prover de forma contínua uma melhor otimização para nossos sites, volta e meia, nos deparamos com algumas diretrizes a respeito do que fazer e não fazer. Algumas delas, inclusive, com certo grau de terrorismo, o que causa um grau de apreensão.  Todavia, tanto receio não é sem fundamento: ser penalizado pelo Google pode trazer consequências gigantes e negativas aos nossos objetivos.

Por outro lado, generalizações não devem ser repassadas como se fossem verdades absolutas. Um exemplo que podemos citar é o de pensar que conteúdo duplicado gera, automaticamente, uma punição por parte dos buscadores, pois essa é uma ideia que algumas vezes pode ser errônea.

Continue a leitura, que iremos desvendar alguns mitos relacionados ao assunto e recomendar soluções para casos que as pedem.

 

O que é um conteúdo duplicado?

Podem existir várias formas de duplicação, sendo a mais conhecida o plágio, mas também há aquela originada sem que haja esse intuito, como a duplicação por um sistema.

No conceito do próprio Google, “conteúdo duplicado geralmente refere-se a blocos substanciais de conteúdo dentro de um ou mais domínios que correspondem totalmente a outro conteúdo ou são muito similares. Em geral, não é uma prática enganosa, a princípio”.

E por que, a princípio, isso não é considerado malicioso?

Porque para conseguir atingir a usabilidade e acessibilidade para o usuário, e assim oferecer uma boa experiência de navegação a ele, a duplicação acaba ocorrendo de maneira natural e sem má intenção.

Na construção de um site, temos a arquitetura da informação, que, de forma bem resumida, tem como uma das funções decidir como as informações serão organizadas e como os componentes de navegação, rolagem e clique serão relacionados. Assim, todo o conteúdo, menu, estrutura, links são pensados para facilitar a experiência do usuário. A duplicação, então, acaba acontecendo naturalmente, pois é um jeito de a web funcionar de forma eficiente, apresentando informações com contexto.

“Mas como os robôs lidam com esse tipo de conteúdo? E o que eu tenho que fazer para não ser penalizado, caso a situação peça uma ação?”, você pode estar se perguntando.

E usaremos uma citação das diretrizes de qualidade do próprio Google para iniciar a resposta:

Conteúdo duplicado em um site não é suficiente para que uma ação seja tomada, a não ser que o objetivo seja enganar e manipular os resultados de mecanismos de pesquisas.

Porém, é necessário saber a origem desse conteúdo, que pode ser, por exemplo:

  • migração para protocolo de segurança, HTTP para HTTPS;
  • domínio com e sem WWW;
  • versões de páginas para imprimir;
  • URLs diferentes apontando para o mesmo conteúdo;
  • press releases e guest posts;
  • URLs parametrizadas;
  • fóruns de discussão, gerando páginas para dispositivos móveis e páginas regulares.

O Google, em muitos casos, consegue identificar a origem de um conteúdo duplicado. Por meio de algoritmos, os robôs reconhecem padrões de URL e a existência de conteúdo duplicado ou relevante, ainda que não rastreie de forma específica o documento.

 

Como identificar ou evitar conteúdo duplicado

Há alguns meios e ferramentas disponíveis para facilitar essa pesquisa, assim como condutas:

 

Use o Google Webmaster Tools

No Google Search Console, por exemplo, na aba “melhorias de HTML” dentro de “aspectos da pesquisa”, você descobre onde estão as duplicações em títulos e meta descrições.

 

Veja as variações do seu domínio

Observe as pequenas variações de domínio que levam a um mesmo lugar, como em:

www.paginadaempresa.com.br e www.paginadaempresa.com.br/pagina

 

Utilize o Copyscape ou ferramentas que detectam plágio

Com essas ferramentas você descobre se seu conteúdo foi plagiado. Ao inserir a URL do seu site, você verifica se há conteúdo dele em outro lugar.

Acesse a ferramenta: Copyscape Plagiarism Checker

 

Evite repetições sem necessidade

Essa é uma orientação do próprio Google. No lugar de você colocar, por exemplo, o mesmo texto de direitos autorais em cada página, insira um link que direcione à página com mais detalhes. Outro exemplo seria consolidar páginas, como no caso de um site de viagens que tenha algumas informações iguais para links de cidades diferentes. Ou o conteúdo deve ser unido, ou expandido com conteúdo único em cada página.

 

 

Mitos com relação ao conteúdo duplicado

Esse assunto pode provocar certo terrorismo e, com isso, surgirem alguns mitos.

 

O conteúdo duplicado afeta o SEO

Conforme você viu, alguma duplicação é necessária para a boa eficiência de um site. Assim, ela não necessariamente afetará a otimização. Todavia, é sempre interessante manter um controle de como a duplicação é gerada, para não haver problemas como indexação inconsistente e ineficiência de rastreamento.

 

O meu site será punido pela duplicação de conteúdo

Lembra-se do que foi dito anteriormente pelo próprio Google? Ele afirma que um conteúdo duplicado não é o único motivo que fará os robôs tomarem uma ação em relação a ele, a menos que tal ação de duplicar tenha sido feita com intenções ruins, como a de manipulação ou monetização de conteúdo alheio.

 

 

Uma versão do site móbile separada representa conteúdo duplicado

Nem sempre. Pode ser que o Google apresente por conta própria a versão que ele ache mais correta. Mas se o site tem uma configuração adaptativa, é recomendado usar a canonical tag.

 

Guest post sempre será um tipo de duplicação de conteúdo

Não! Só será se for um conteúdo copiado do original. Nesse caso, pode prejudicar quem posta as cópias. Fique atento e prefira sempre conteúdo original, mesmo quando for para publicar um conteúdo em outro site como um autor convidado (Guest Post).

 

Possíveis consequências para duplicação de conteúdo

A consequência será de acordo com o tipo de duplicação encontrada.

 

Quando há tentativa de manipular os buscadores

Esse tipo de prática, às vezes, é feito como tentativa de conseguir mais tráfego. Isso pode resultar em uma experiência ruim ao usuário, pois pode haver o mesmo conteúdo apresentado diversas vezes no mesmo resultado de busca. Nesses casos, o Google poderá diminuir a classificação do site ou removê-la dos indexadores.

Por tais motivos, você deve evitar condutas como páginas doorway e monetização por conteúdos copiados.

 

Quando não há intenção de burlar os buscadores

Em situações como a de mais de uma página com conteúdo idêntico, que acontece quando há versões de páginas normais e páginas para impressão, e elas não estão bloqueadas com a devida tag, o Google escolherá uma delas para apresentar no resultado da pesquisa. Nem sempre a que ele escolhe é a que garante a melhor experiência ao usuário, pois essa escolha dependerá de alguns fatores algorítmicos.

Pode acontecer também uma inconsistência de métricas, pois os robôs podem não mostrar exatamente os mesmos resultados nas pesquisas.

Outra possibilidade é a dificuldade de ranqueamento, se os links que seu site recebe de outro direcionarem para URLs diferentes das que você considera a principal.

Ou ainda baixa eficiência no rastreamento de um site, quando as páginas duplicadas bloqueiam o rastreamento das mais importantes.

 

Soluções para diminuir o conteúdo duplicado

Em alguns momentos será necessário ter uma intervenção manual para melhorar a eficiência no processo de rastreamento (crawling) pelos motores de busca ou até impedir que se tenha alguma seção que não tenha sido rastreada. O crawling é necessário para que a página seja indexada, posteriormente, pelos Googlebots.

Assim, a primeira etapa para corrigir um problema de conteúdo duplicado é saber a sua causa e entender a influência no site para depois consolidar as URLs indexáveis. Entre as possíveis soluções, temos:

 

Canonicidade de URLs

Por meio da tag HTML <link rel=”canonical”> se cria uma referência estatística no HTML apontado para a URL preferencial para indexação. É bastante usada em links que, apesar de duplicados, precisam existir, como em e-commerces que mostram diferentes tamanhos de roupas.

 

Redirecionamento 301

Ao contrário do anterior, as URLs com conteúdos iguais não precisam funcionar em paralelo. É o que acontece com sites digitados com ou sem WWW ou HTTP e HTTPS. Usando esse método, os usuários e robôs são direcionados ao documento principal.

 

Metatag noindex

É usada para impedir que uma página seja indexada no Google. É uma opção para usar quando se trabalha com páginas para impressão, evitando que elas apareçam nos resultados, e assim, em seu lugar, apareçam as originais.

 

Configuração de parâmetros de URL

O Google Search Console pode ser usado para as situações em que se trabalhe com plataformas fechadas e não haja possibilidade de mexer com o código. Ele disponibiliza ações como especificações de parâmetros nas URLs. Contudo, por ser ferramenta do Google, a alteração é visível apenas para esse buscador.

 

Análise de plágio

Nessa situação é preciso avaliar o tamanho do conteúdo copiado e se isso foi feito com má intenção. Geralmente, o primeiro passo é tentar resolver a situação de forma polida, entrando em contato com o dono do site. Para os casos mais complicados, o Google dispõe de um formulário para sinalizar os conteúdos copiados.

Como você viu, a duplicação existe por muitas razões e nem todas são com finalidade prejudicial nem terão a consequência imediata de punição. É preciso fazer uma análise do conteúdo duplicado que existe no seu site, avaliar como ele influenciará no desempenho da página para saber o melhor tipo de decisão a ser tomada.

E já que você se preocupa em apresentar um site com boa experiência de navegação, que tal entender um pouco sobre como preparar mini conteúdos para chatbots?

Se você ainda não tem esse know-how, te recomendo conhecer o trabalho oferecido pelo Meu Redator, que conta com profissionais capazes de colocar todas essas táticas em prática, em benefício da sua empresa.