Antes de começarmos é necessário um breve entendimento sobre o modus operandi dos motores de busca, dado que a quantidade de páginas na web cresce a cada dia. Para conseguir acompanhar este ritmo, os buscadores utilizam-se de robôs que acessam as páginas web, seus links e registram informações da página (como tempo de resposta, prioridade de informações, entre outras).
Nesta etapa de registro das informações, são atribuídos níveis de relevância através de palavras-chaves específicas, quantidade de referências externas nas páginas e outros critérios particulares de cada buscador. Fazer com que estes resultados estejam com o melhor posicionamento possível nos mecanismos de pesquisa se dá através de um trabalho de SEO (Search Engine Optimization). Apesar de não influenciar diretamente os rankings de pesquisa, queremos facilitar o trabalho destes buscadores indicando de forma direta e estruturada o caminho até nossas páginas, e esta é a função principal dos sitemaps.
Sitemaps e sitemaps index são componentes da especificação do protocolo Sitemap, que é a melhor maneira de desenvolvedores web informarem aos motores de busca sobre o conjunto de páginas que compõem o seu site.
Para saber mais sobre o assunto, confira o artigo!
Características e Informações
Geralmente, os sitemaps são arquivos XML que listam informações das diversas URLs em um site, através de tags que as referenciam em diferentes níveis de relevância para o Google, Bing, Yahoo, Baidu dentre outros.
O Google recomenda a criação de sitemaps com no máximo 50.000 URLs, no entanto, para fins de otimização, o ideal é que este número esteja abaixo de 10.000.
Arquivos de sitemap frequentemente são limitados à 10MB de tamanho, caso seja necessário o uso de mais de um sitemap, os chamados sitemap index são usados para fazer o agrupamento de múltiplos sitemaps existentes.
Idealmente, estes arquivos devem ser implantados na raíz do site ou enviados de forma direta aos mecanismos de pesquisa através de um painel de controle ou interface administrativa.
O mais trivial, e também mais importante, é que o sitemap esteja cadastrado no Google. Este procedimento pode ser efetuado através de uma ferramenta do Google Search Console.
Robots.txt
Não informar o endereço de um sitemap vai contra o seu propósito primário de tornar mais fácil o trabalho dos motores de pesquisa. Isto é feito através da criação de um arquivo "robots.txt". Se informarmos as Search Engines sobre a localidade do sitemap, se torna muito mais viável realizar este trabalho de forma eficiente.
O arquivo robots.txt específica onde se encontra o XML do sitemap para utilização, além de outras funcionalidades como ignorar URLs específicas e até sub páginas inteiras (páginas repetidas, de impressão e de login usualmente devem ser ignoradas).
Dica: Saiba mais sobre as funcionalidades do robots.txt clicando aqui.
Configurações e Tags
Um sitemap pode ser feito através da criação de arquivos ".txt", ".xml" e até mesmo convertido em ".html". No formato txt, o arquivo será composto apenas com as URLs listadas, sem o uso de tags. A conversão para html é possível, mas não é recomendada uma vez que erros durante este processo acontecem com facilidade. Aqui na Orgânica optamos por fazer o uso dos arquivos em formato XML que é mais flexível e completo para esta tarefa.
Dentro de um sitemap, uma variedade de tags é utilizada para estruturar informações sobre as URLs contidas nele. Algumas tags são obrigatórias e outras opcionais. Iremos detalhar cada uma delas a seguir.
Tags Sitemap
- <urlset>: (obrigatória) indica o escopo do conjunto de URLs a serem rastreadas e contém uma ou mais tags <url>
- <url>: (obrigatória) é a tag principal de cada entrada no sitemap e todas as tags subsequentes estarão relacionadas à esta.
- <loc>: (obrigatória) é a tag que contém a localidade da URL e deve iniciar com o protocolo necessário da página (ex: http://) e dependendo das características do servidor do site, deve terminar com "/".
- <lastmod>: (opcional) guarda a data da última alteração feita em determinada na URL em questão.
- <changefreq>: (opcional) apesar de ser uma tag opcional, esta é muito importante pelo fato de definir a frequência que os mecanismos de pesquisa irão avaliar a URL. É possível que o intervalo de tempo entre as consultas possa variar.
- Sobre os valores desta tag:
-
always: transforma a URL em uma nova página aos olhos dos mecanismos de pesquisa constantemente.
-
never: usa-se em casos de arquivamento de URLs e sites antigos, no entanto, alguns mecanismos ainda checam periodicamente páginas com esta marcação para verificar possíveis alterações ou indisponibilidades.
-
Intuitivamente temos também: -hourly, -daily, -weekly and -yearly.
-
- Sobre os valores desta tag:
- <priority>: (opcional) define o nível de prioridade de uma URL dentro do sitemap, podendo ser definido a partir de 0.0, menos importante, até 1.0, mais importante. Tendo como valor default 0.5. Enfatizando apenas que isto não define o quão bem suas páginas estarão posicionadas nos mecanismos de busca, apenas define o quão importantes elas são dentro do seu sitemap.
Tags Sitemap Index
- <sitemapindex>: (obrigatória) utilizada no início de um sitemap index. Esta tag referência o escopo dos sitemaps rastreados e contém ao menos uma tag <sitemap>
- <sitemap>: (obrigatória) esta tag referência as informações contidas em um sitemap.
- <loc>: tag que contém a localidade do sitemap em questão.
- <lastmod>: (opcional) utilizar esta tag em um sitemap index não informa a útlima modificação de URLs dentro dos sitemaps, mas sim do arquivo sitemap index em si.
Outros usos do Sitemap
Na Orgânica a utilização de geradores de sites estáticos como Middleman automatiza a tarefa de construção do sitemap, já em projetos em Rails utilizamos uma gem que cumpre a mesma função. A utilização de sitemaps na etapa de implantação de sites permite a identificação fácil das URLs do site para realizar redirecionamentos e monitoramento de páginas específicas.
Após este artigo, esperamos que você tenha entendido o valor que este ativo tem para os motores de busca e o quanto ele facilita a identificação de links relevantes e outras tarefas relativas a eles.
Ainda tem alguma dúvida sobre sitemaps? Qual outro uso você daria para eles? Participe deixando um comentário na seção abaixo!