Categorias
SEO

Como o Google lida com sites baseados em JavaScript

A Pesquisa do Google tem a capacidade de executar JavaScript com limitações.

Portanto, é fundamental garantir que o conteúdo da página apareça devidamente no HTML renderizado.

Como o Google processa as páginas da web

O Googlebot processa páginas da Web em JavaScript em três fases: rastreamento, renderização e indexação

Aqui está uma ilustração simples desse processo:

1 – Fila de rastreamento

O Googlebot, o rastreador, atualiza continuamente a lista de URLs a serem rastreadas com base em vários sinais, como mapas do site, links descobertos em outras páginas e alterações em páginas existentes.


2 – Rastreador

Quando o Googlebot solicita o HTML de uma página, ele também envia vários sinais para o servidor da web, como o agente do usuário (indicando que é um rastreador) e o idioma preferido para a resposta.


3 – Processamento

O HTML é analisado e analisado para extrair vários sinais, como links para outras páginas, dados estruturados (como marcação schema.org) e meta tags (como o título e descrição).

O Google também procura por práticas de spam ou manipulação, como texto ou links ocultos, enchimento de palavras-chave e ocultação.

Descoberta de URL

URLs encontrados na página são adicionados à Fila de Rastreamento, mas alguns podem ser filtrados com base em vários critérios, como conteúdo duplicado ou baixa qualidade.

Indexação

O Google verifica vários sinais para determinar se a página deve ser indexada (adicionada ao índice de pesquisa) ou não. Por exemplo, páginas com uma meta tag “noindex” ou no arquivo robots.txt são excluídas.

Páginas que já estão no índice também podem ser re-rastreadas para verificar atualizações, como novo conteúdo ou alterações no conteúdo existente.

Renderização

O Google verifica se a página requer renderização de JavaScript para ser exibida corretamente. Se sim, ele adiciona a URL à Fila de Renderização para ser renderizada pelo Serviço de Renderização da Web (WRS).

O Google também pode usar uma versão em cache da página para resultados de pesquisa até que a versão renderizada esteja disponível.

Canonização

O Google tenta identificar a versão canônica de uma página, que é a URL preferida a ser exibida nos resultados de pesquisa. Isso pode envolver olhar para o elemento de link rel = “canonical”, cadeias de redirecionamento e outros sinais.


4 – Fila de Renderização

URLs que requerem renderização de JavaScript são adicionadas à Fila de Renderização, que é processada pelo Serviço de Renderização da Web.


5 – Renderizador

O WRS renderiza a página usando um navegador sem cabeçalho (como o Chrome) e envia o HTML renderizado de volta para processamento adicional.


6 – Índice

O HTML renderizado é analisado e analisado para extrair sinais adicionais, como conteúdo que foi gerado dinamicamente pelo JavaScript. O Google também verifica dados estruturados e links e calcula vários sinais, como PageRank (que mede a importância de uma página com base no número e qualidade de links para ela).


7 – Classificação (ranking)

O algoritmo de classificação do Google usa o índice para fornecer resultados de pesquisa relevantes para cada consulta. O algoritmo leva em consideração vários sinais, como a relevância e qualidade do conteúdo.

Para que o Google entenda uma página que depende fortemente de JavaScript, é necessário que ele passe pela fase completa de renderização, em vez de poder acessá-la diretamente.


JavaScript e os problemas de SEO

Simplificando, o Google não pode indexar o conteúdo até que o JavaScript tenha sido renderizado – esse processo poderá ser bastante complicado especialmente em sites parrudos,  já que será preciso realizar uma dupla verificação e renderizar todas as páginas do site.

Isso poderá afetar negativamente o desempenho de SEO.

Embora o atraso entre o rastreamento e a renderização tenha diminuído com as melhorias recentes no Googlebot, não há garantia de que o Google executará o código JavaScript em espera em sua fila WRS, por motivos como:

  • Bloqueado em robots.txt
  • Tempo limite
  • Erros

Assim, o JavaScript causa problemas de SEO quando o conteúdo principal depende dele, mas não é renderizado pelo Google.

A renderização de JavaScript é muito mais pesada em recursos para o Google do que apenas analisar HTML.

Ao usar JavaScript no site, é importante se certificar de que o conteúdo, imagens e links sejam exibidos mesmo com o JavaScript desativado.

Por David Breder

Profissional graduado em tecnologia e Marketing. Especialista em SEO com experiência na gestão ágil de projetos com foco consultivo, estratégico e orientados a performance orgânica.

error: