Milhões de Páginas que Ninguém Deveria Ver
Um dos maiores erros que um eCommerce pode cometer é permitir que o Google rastreie e tente indexar páginas que não têm qualquer valor SEO. Foi exatamente isso que aconteceu nesta loja online de mobiliário internacional: mais de 2.000.000 de URLs estavam a ser rastreadas sem qualquer possibilidade real de aparecer no Google.
O que significa que uma página seja “rastreada mas não indexada”?
Quando o Google “rastreia” uma página, simplesmente visita-a. Faz isso porque considera que pode ser útil ou nova. Mas se verificar que a página é duplicada, vazia, redundante ou está mal configurada, decide não a indexar, ou seja, não a mostrar nos resultados de pesquisa.
Até aqui pode parecer inofensivo. Mas não é.
O problema é que o Google tem um orçamento limitado para rastrear cada site, o chamado crawl budget. Se esse orçamento é gasto em lixo técnico, o Google ignora as páginas valiosas: os teus produtos reais, as tuas categorias principais, as tuas fichas bem trabalhadas.
O que Detetámos? 7 Grandes Fugas de SEO Técnico
Durante a auditoria inicial, usando o Google Search Console e os ficheiros de cobertura, detetámos:
✅ Mais de 2 milhões de URLs rastreadas e não indexadas
✅ URLs duplicadas por filtros, pesquisas, moedas ou paginação
✅ Páginas multilingues tratadas como conteúdo duplicado
✅ Um sitemap cheio de lixo técnico
✅ Produtos obsoletos ou sem descrição indexáveis
✅ Redirecionamentos em cadeia e erros 3xx ocultos
✅ Canonicals mal colocados que confundiam o Google
Exemplos Reais do Desastre
Estes são exemplos reais extraídos do relatório:
https://oculto-por-confidencialidad.store/fr/47-paravents?q=Largeur-180cm&resultsPerPage=24https://oculto-por-confidencialidad.store/es/17-mesas-de-oficina-operativas-y-direccion?p=2&orderby=pricehttps://oculto-por-confidencialidad.store/ca/taules-escriptori?id_currency=2&q=Profunditat-75cm
Nenhuma destas URLs deveria existir para o Google. São combinações de filtros, parâmetros de pesquisa, moeda e ordenação que geram milhares de versões para cada categoria.
Bloqueio Inteligente e Cirurgia Técnica
1. robots.txt: o muro de contenção
Alterámos o ficheiro robots.txt para bloquear o acesso do Google a todas as URLs inúteis, preservando assim o crawl budget para as páginas que realmente importam.
# Parâmetros de pesquisa e filtragem
Disallow: /?q=
Disallow: /&q=
Disallow: /?resultsPerPage=
Disallow: /&resultsPerPage=
Disallow: /?orderby=
Disallow: /&orderby=
Disallow: /?id_currency=
Disallow: /&id_currency=
# Paginações duplicadas
Disallow: /?p=
Disallow: /&p=
Com isto, mais de 2 milhões de URLs deixaram de ser rastreadas em menos de um mês. O Google começou a focar-se nas páginas canónicas reais.
2. Canonicalização perfeita
Realizámos uma auditoria linha a linha para garantir que:
- Todas as páginas importantes (produtos e categorias principais) usam
rel="canonical"apontando para elas próprias. - Todas as versões com parâmetros apontam para a URL limpa.
- Cada idioma canonicaliza apenas a sua própria versão.
Exemplo corrigido:/fr/47-paravents?q=Largeur-180cm → canonical aponta para /fr/47-paravents
3. Redirecionamentos auditados um a um
- Detetámos redirecionamentos em cadeia, alguns com 3–4 saltos.
- Eliminámos passos intermédios e deixámos apenas 301 diretos.
- As páginas eliminadas sem substituto agora devolvem 404 ou 410, como recomenda o Google.
4. hreflang para dominar os idiomas
O site tem versões em 6 idiomas: espanhol, inglês, francês, italiano, português e catalão. Mas o Google não sabia qual era qual.
Implementámos etiquetas hreflang como esta em cada cabeçalho:
<link rel="alternate" hreflang="es" href="https://oculto-por-confidencialidad.store/es/..." /> <link rel="alternate" hreflang="en" href="https://oculto-por-confidencialidad.store/en/..." /> <link rel="alternate" hreflang="x-default" href="https://oculto-por-confidencialidad.store/" />
Isto eliminou os conflitos de duplicação entre idiomas e melhorou o posicionamento internacional.
5. Revisão completa do sitemap
Foram removidas do sitemap todas as URLs que continham:
- Parâmetros (
?q=,&orderby=, etc.) - Idiomas duplicados sem canonical
- Produtos sem conteúdo útil
Gerou-se um novo sitemap limpo, apenas com produtos e categorias reais, sem qualquer vestígio de URLs sujas.
6. Páginação: controlo cirúrgico
As URLs como ?p=2 agora:
- Apenas são indexadas se contiverem produtos úteis.
- Usam
rel="canonical"apontando para elas próprias. - São ligadas internamente se fizerem parte de uma categoria ativa.
7. Depuração de produtos inúteis
Mais de 800 produtos estavam indexáveis mas vazios, sem descrição, sem stock ou sem sentido.
Soluções:
- Os produtos antigos foram eliminados ou marcados como 404.
- Revisou-se o sistema para impedir que o PrestaShop gere páginas de produto sem stock ou sem conteúdo.
Impacto SEO em 30 Dias
📉 -88% de URLs rastreadas desnecessárias
📈 +41% de cobertura efetiva no GSC
🌍 +37% de visibilidade nas versões internacionais
💡 O Google rastreia agora apenas o conteúdo útil do site
Também estás a deixar que o Google gaste o teu orçamento em páginas inúteis?
📩 Contacta-nos e fazemos uma auditoria sem compromisso.
![Aprenda como criar seu feed de produtos do PrestaShop para o Google Merchant Center [sem erros ou bloqueios]](https://avafaconsulting.pt/wp-content/uploads/2025/11/enlazar-Google-Merchant-Center-con-Google-Business-Profile.png)
