Indexação para busca na web
Preparo de site para buscas (SEO)
O preparo de um site para os primeiros lugares dos resultados das buscas, SEO, search engine optimization, ou otimização para buscadores, ajuda a melhorar o posicionamento no ranking de resultados. Ações estruturais incluem:
■ Definir as palavras e expressões mais importantes para os objetivos do site e verificar, nas estatísticas de acesso, as mais utilizadas (e importantes) nos buscadores pelos usuários. Valorizá-las nos textos para que sejam encontradas facilmente, inserindo-as no início dos textos. Incluir títulos (title tags) relevantes e únicos em cada página. Acompanhar as palavras-chave usadas na ferramenta de busca interna, para a verificar as necessidades de informações do público – no conteúdo e na estrutura de navegação.
Caso o site publique conteúdo em diversos idiomas, é importante verificar expressões regionais ou de segmento, evitando simplesmente traduzi-las a partir das palavras originais.
Deve-se evitar a repetiçãoexcessiva destas palavras, para não atrapalhar a leitura e a compreensão do texto. O Google cada vez mais aperfeiçoa os algoritmos para a percepção de sinônimos e expressões em língua natural. Por isto, não se deve dar importância absoluta a palavras-chave publicadas apenas para os buscadores, sem priorizar os interesses do público. (6)
■ Promover a publicação de URLs em sites de parceiros, contatos, clientes, assinantes, comunidades, redes sociais, blogs. E também a divulgação no boca-a-boca de colegas, amigos e parentes, que estimulam a criação de links e aumentam a popularidade do site. As mídias sociais têm cada vez mais importância nas buscas, pois reúnem a participação e a opinião de milhões de pessoas sobre diferentes sites e páginas web.
Os links não devem ir apenas para a página Principal, mas para as que têm relação direta com o conteúdo da páginas de saída.
A publicação de artigos em outros sites e a participação em programas de afiliação também aumentam a visibilidade da URL.
■ Atualizar permanentemente o conteúdo, para indicar que o site está em atividade e interessado em atender o seu público. O Google vem atualizando seus algoritmos continuamente para rastrear conteúdo recente (blogs, fórums e vídeo) e manter os resultados das buscas sintonizados com a publicação de conteúdo em tempo real. (6)
■ Atualizar permanentemente as referências ao site em mídias sociais, como Twitter, Facebook, Google+, valorizadas pelos buscadores como fonte de referência e informação para indexação em tempo real. A estratégia de palavras-chave também se extende estes a canais, bem como a emails e publicidade off-line.
O conjunto de citações, comentários, links destes sites para uma plataforma web compõe o seu posicionamento estratégico online. Likes no Facebook e +1s no Google podem não obrigatoriamente garantir bom ranking em resultado de busca mas aumentam visibilidade e valor da marca, e favorecem o posicionamento nas buscas. (5)
A Gigya empresa de otimização de sites para mídias sociais, verificou dados da Compete de novembro de 2009 e concluiu que algumas grandes empresas de mídia dos EUA se beneficiavam do efeito das redes sociais. O USA Today por exemplo, tinha 35% dos seus links de referência (referals) em mídias sociais e 6% no Google. Na People Magazine a proporção era de 23% para mídias sociais e 11% para o Google. E na CNN a mesma relação era de 11% para mídias sociais e 9% para o Google. (4)
■ Preparar as URLs das páginas com palavras relacionadas ao conteúdo, para que os sites de busca liguem os assuntos ao endereço. Mas URLs muito longas dificultam a digitação e o arquivamento dos usuários e não são bem aceitas pelos buscadores.
■ Preparar o código HTML para a indexação e rapidez de carregação. Se os arquivos CSS e de JavaScript ficam localizados em arquivos fora das páginas, a redução do tamanho do código de cada uma é razoável e favorece a sua indexação. Este aspecto recomendável, especialmente para a manutenção da acessibilidade do arquivo, mas não uma prioridade para buscas, a validação do código do site em relação aos padrões web.
■ Otilimizar a usabilidade da interface, na medida em que ganham importância as conversões de acessos em vendas, o volume de cadastros, de compartilhamento de informações, bem como as taxas de rejeição, o tempo de permanência no site, a origem dos acessos, a taxa de retorno dos usuários, a reputação do site entre seus clientes, consumidores, seguidores.
■ Preparar a arquitetura da informação para a indexação. O conteúdo mais importante deve ficar localizado nas camadas superficiais, de modo que as aranhas dos buscadores o encontrem mais facilmente.
A navegação pelas principais páginas do site não deve exceder 3 ou 4 níveis. Sites mais "planos" facilitam o percursos das aranhas dos buscadores. Sites com muitas camadas e níveis mais profundos devem prover páginas em camadas intermediárias que publiquem as principais palavras-chave das páginas situadas em níveis mais profundos. (2)
A arquitetura é também crítica na medida em que os buscadores cada vez mais priorizam os caminhos dos usuários antes e depois de acessarem cada página ou site, de modo a personalizar os percursos para o perfil de cada usuário.
■ Aplicar títulos e nomes consistentes nas páginas e nos arquivos (imagens, PDFs, vídeos) - os sites de busca também levam estes termos em consideração para indexar conteúdo em diferentes formatos. → Exemplo
■ Associar textos aos links que reflitam o conteúdo apontado. Os textos dos links ou textos-âncora (anchor text) são importante fator para a indexação dos buscadores.
■ Inserir meta informações sobre o conteúdo, como "robots", "keywords" e "description", mesmo que não sejam o principal fator indexador utilizado pelas ferramentas.
Aplicar também marcações para as páginas que não devem ser indexadas, como
<META NAME="robots" content="noindex, nofollow">.
■ Acompanhar as atualizações dos métodos e algoritmos dos buscadores, que mudam sempre (assim como a posição dos links no ranking de cada uma).
■ Preparar os links do site para indexação, mas evitar listas de links fora de contexto e marcações enganosas para forçar um ranking privilegiado nos resultados.
■ Publicar um mapa do site facilmente indexável (em modo texto) com os títulos e URLs da maioria das páginas ou das principais áreas de conteúdo.
■ Publicar arquivos sitemap.xml, com informações sobre o site para os principais buscadores. Estes arquivos contêm listas de URLs e atributos que facilitam a indexação, complementando a varredura do conteúdo pelas "aranhas" dos sites. Proveem informações sobre as páginas a ser indexadas em caráter prioritário e as páginas atualizadas mais recentemente.
■ Publicar arquivos robots.txt, que avisem aos sites de busca que diretórios de um site não devem ser indexados ou que agentes não devem indexar o site.
-> Por exemplo
User-agent: Googlebot
Disallow: /
User-agent: *
Disallow: cgi-bin
Disallow: imagens
Disallow: javascript
Disallow: estilos
Sitemap: http://www.nomedosite.com.br/sitemap.xml
O texto acima, exemplo de texto de um arquivo robots.txt, avisa ao agente de busca do Google (Googlebot) para não indexá-lo. E aos agentes de todas as ferramentas (*) a não indexar os diretórios "imagens", "javascript" e "estilos".
Na última linha, o protocolo Sitemap Autodiscovery permite que o sitemap na raiz de um site seja rastreado por todas os sites de busca sem necessidade de submeter o arquivo a cada uma.
■ Preparar os arquivos de vídeo e áudio com legendas e textos alternativos ("alt tags"), facilitando a indexação com descrições do conteúdo e informações de autoria e direitos de publicação
■ Preparar arquivos em Flash com legendas e textos alternativos, pois muitos são reconhecidos como imagem e os links são indexados de maneira muito simplificada.
O Google foi a primeira ferramenta de busca cujas aranhas examinaram arquivos de Flash (swf), no entanto ainda é preciso preparar os arquivos para facilitar o acesso, de modo que que os textos sejam acessíveis e as URLs rastreáveis. A publicação de textos alternativos, descrevendo o conteúdo dos arquivos, ainda é uma boa prática, embora estes arquivos sejam cada vez menos usados por sua incompatibilidade com dispositivos móveis da Apple.
■ Aplicar normas de acessibilidade, que formatam o conteúdo para facilitar a sua indexação.
■ Em caso de uso de sistema de gerenciamento de conteúdo, verificar se o conteúdo é exportável, para permitir a indexação.
■ Aperfeiçoar continuamente o site para a indexação pelos buscadores, com base nas estatísticas de acesso, em mudanças nos algoritmos das ferramentas, nos hábitos e demandas dos usuários. Este processo faz parte dos processos regulares de gestão e manutenção do canal online.
■ Em caso de redesenho, preparar o canal para indexação pelos buscadores desde o planejamento do projeto até o desenvolvimento das páginas.
Assuntos relacionados
→ Gestão de marca online
→ Extensão e a profundidade da estrutura
→ Estatísticas do servidor (server logs)
→ SEO para dispositivos móveis (mobile SEO)
Referências sobre SEO
→ The beginners guide to SEO, Mike Grehan (SEOMoz, acesso em 6.4.2013)
6) Google gets better at not having to send users to other sites, Chris Crum (WebProNews, acesso em 14.8.2012)
→ How search engines work, Mike Grehan (SearchEngineWatch, acesso em 11.1.2012)
5) Social signals & SEO: Focus on authority, Eric Enge (SearchEngineWatch, acesso em 4.11.2011)
4) Search and rescue: How to become findable and shareable in social media, de Brian Solis (SearchEngineWatch, acesso em 7.4.2010)
→ As SERPs get more complicated, focus on relevant elements, Chris Crum (WebProNews, acesso em 13.3.2010)
2) SEO e A.I. – Arquitetura da informação, Frank Marcel (MestreSEO, acesso em 26.11.2009)
Ferramentas relacionadas a SEO
Glossário
■ Relevância – Seleção de informações úteis, pertinentes para uma necessidade de informação. Um documento é relevante se contribui para satisfazer a necessidade de informação de um determinado usuário. É um termo bastante aplicado nas buscas online, que procuram situar os resultados mais relevantes no alto das listas de resultados.
A publicação de conteúdo deste site
impressa ou online sem autorização
dos autores está sujeita a sanções legais