WikiPlus

robots.txt para e-commerce: proteja e otimize sua loja virtual

Lojas virtuais têm desafios únicos de SEO, e o robots.txt desempenha papel crucial na gestão desses desafios. URLs de carrinho, checkout, perfil de usuário, resultados de busca interna e filtros combinados de produtos podem gerar milhares de URLs sem valor de SEO que desperdiçam o crawl budget do Google e potencialmente criam conteúdo duplicado. Uma configuração correta do robots.txt para e-commerce protege essas áreas, direciona o Googlebot para as páginas de produto e categoria que realmente importam, e é o primeiro passo para um SEO técnico sólido em qualquer plataforma de vendas online.

URLs de e-commerce que devem ser bloqueadas no robots.txt

Em lojas virtuais, as categorias de URL que tipicamente não têm valor de SEO e devem ser bloqueadas incluem: Carrinho e checkout (/cart, /checkout, /pedido, /pagamento) — conteúdo transacional sem valor informacional. Área do cliente (/minha-conta, /meus-pedidos, /perfil) — requer login, bots não acessam de qualquer forma. Resultados de busca interna (/search, /busca?q=) — infinitos e com conteúdo duplicado/irrelevante. Filtros combinados de produto (quando mais de um filtro gera URL única). Ordenações de produto (/produtos?ordem=preco, /produtos?sort=avaliacao). Comparação de produtos (/comparar). Listas de favoritos (/favoritos, /wishlist). Páginas de print (/imprimir, /print). URLs com parâmetros de sessão ou tracking gerados automaticamente. O Gerador de Robots.txt da WikiPlus inclui templates específicos para e-commerce com essas regras pré-configuradas.

URLs de e-commerce que devem ser rastreadas e indexadas

Em contrapartida, as URLs de alto valor de SEO que devem ser plenamente rastreáveis incluem: Páginas de produto com URL limpa e única (/produtos/nome-produto). Páginas de categoria e subcategoria (/camisetas, /calcados/tenis). Blog e conteúdo informacional (/blog/como-escolher-tenis). Páginas de coleção ou promoção com conteúdo único (/colecao-verao-2026). Página inicial, sobre, contato e páginas institucionais. Para lojas com produtos acessíveis por múltiplas categorias, use canonical tags apontando para o URL de categoria principal. Para páginas de paginação de categoria (/categoria/pagina/2), o debate entre usar canonical para a página 1 ou permitir rastreamento de todas as páginas depende do volume de produtos e da profundidade da paginação — páginas com produtos únicos não encontráveis de outra forma devem ser rastreáveis.

robots.txt para Shopify, WooCommerce e Magento

Cada plataforma de e-commerce tem suas particularidades no robots.txt. Shopify: por padrão, o Shopify cria um robots.txt que bloqueia /admin, /cart, /checkout e /account. Desde 2021, o Shopify permite customização do robots.txt via app ou edição do template robots.txt.liquid. WooCommerce (WordPress): use o plugin Yoast SEO para configurar o robots.txt e combine com configurações de crawl do WooCommerce. Bloqueie /cart, /checkout, /my-account, /?add-to-cart= e /?orderby=. Magento: Magento 2 tem robots.txt configurável no admin em Marketing > SEO & Search > Edit Robots.txt. Por padrão, bloqueia /admin/ e várias URLs internas. Verifique e adicione bloqueios específicos para filtros de layered navigation. Em todos os casos, o Gerador de Robots.txt da WikiPlus pode criar o arquivo base que você adapta para a plataforma específica.

Integrando robots.txt com sitemap XML em e-commerce

Para máxima eficiência de SEO em e-commerce, robots.txt e sitemap XML devem trabalhar em harmonia. O robots.txt deve sempre incluir a localização do sitemap: Sitemap: https://sualoja.com.br/sitemap.xml. O sitemap XML deve incluir apenas URLs que não estão bloqueadas no robots.txt — URLs em ambos (bloqueadas e no sitemap) enviam sinais contraditórios ao Google. Para lojas com muitos produtos, um sitemap hierárquico funciona melhor: sitemap_index.xml referenciando sitemap_produtos.xml, sitemap_categorias.xml, sitemap_blog.xml. Inclua apenas produtos com estoque disponível no sitemap principal — produtos sem estoque permanente podem ir para um sitemap separado ou ser excluídos. Use lastmod no sitemap para indicar quando cada página foi atualizada — isso ajuda o Google a priorizar o rastreamento de páginas com mudanças recentes (como novos produtos ou preços atualizados).

Perguntas frequentes

Devo bloquear páginas de produto sem estoque no robots.txt?
Depende. Se o produto pode voltar ao estoque, mantenha a página indexável com noindex temporário. Se o produto foi descontinuado permanentemente, use redirecionamento 301 para o produto substituto ou categoria, e não bloqueie no robots.txt (o redirecionamento transfere o link equity). Evite manter páginas de produto sem estoque indexadas com conteúdo estático por muito tempo.
Como bloquear URLs de filtro sem bloquear URLs de categoria?
Use a especificidade de padrões: Allow: /categorias/ seguido de Disallow: /categorias/*?* bloqueia URLs da categoria com parâmetros de query (filtros) mas permite URLs de categoria sem parâmetros. Teste no Testador de robots.txt do Search Console para confirmar o comportamento.
Páginas de avaliação de produtos devem ser bloqueadas?
Não. Páginas de avaliação e reviews de produtos têm alto valor de SEO — são conteúdo único gerado por usuários (UGC) que inclui linguagem natural de busca. Permita que o Google rastreie e indexe páginas de avaliação de produto, especialmente se elas têm URL própria e volume de conteúdo significativo.