Indexação para busca na web
Preparo do site para indexação (SEO)
O preparo de um site para os primeiros lugares dos resultados das buscas é conhecido em português pela expressão "otimização para buscadores" (ou SEO, search engine optimization). Algumas medidas de caráter geral ajudam a melhorar este posicionamento no ranking de resultados, como as indicadas abaixo. Para maior detalhamento, veja as outras páginas desta seção.
■ Verificar, nas estatísticas de acesso, as palavras-chave mais utilizadas (e também as mais importantes) nos buscadores para acessar o site e inseri-las nos textos de forma que os usuários as encontrem facilmente. É importante inserir as palavras-chave mais importantes no início dos textos, incluir títulos (title tags) relevantes e únicos em cada página e atualizar permanentemente o conteúdo publicado. No entanto, deve-se limitar a repetição destas palavras, para não atrapalhar a leitura e a compreensão do texto.
O acompanhamento das palavras-chave usadas na ferramenta de busca interna permite a verificação e o atendimento das necessidades de informações do público – no conteúdo e na estrutura de navegação.
Caso o site publique conteúdo em diversos idiomas, é importante verificar as expressões regionais das principais palavras e expressões usadas nas buscas, evitando simplesmente traduzi-las a partir da sua versão original.
■ Promover a publicação de URLs em sites de parceiros, contatos, clientes, assinantes, comunidades, redes sociais, blogs. E também a divulgação no boca-a-boca de colegas, amigos e parentes, que estimulam a criação de links e aumentam a popularidade do site. As mídias sociais têm cada vez mais importância nas buscas, pois reúnem a participação e a opinião de milhões de pessoas sobre diferentes sites e páginas web.
Os links não devem ir apenas para a página Principal, mas para as que têm relação direta com o conteúdo da páginas de saída.
A publicação de artigos em outros sites e a participação em programas de afiliação também aumentam a visibilidade da URL.
■ Atualizar permanentemente o conteúdo, de modo a indicar que o site está em atividade e interessado em atender o seu público. O Google vem atualizando seus algoritmos continuamente para rastrear conteúdo recente (blogs, fórums e vídeo) e manter os resultados das buscas sintonizados com a publicação de conteúdo em tempo real. (6)
■ Atualizar permanentemente as referências ao site em mídias sociais, como Twitter, Facebook, Google+, valorizadas pelos buscadores como fonte de referência e informação para indexação em tempo real. O conjunto de citações, comentários, links destes sites para uma plataforma web compõe o seu posicionamento estratégico online. Likes no Facebook e +1s no Google não podem não obrigatoriamente garantir bom ranking em resultado de busca mas aumentam visibilidade e valor da marca, e em consequência favorecem o posicionamento nas buscas. (5)
A Gigya empresa de otimização de sites para mídias sociais, verificou dados da Compete de novembro de 2009 e concluiu que algumas grandes empresas de mídia dos EUA se beneficiavam do efeito das redes sociais. O USA Today por exemplo, tinha 35% dos seus links de referência (referrals) em mídias sociais e 6% com origem no Google. Na People Magazine a proporção era de 23% para mídias sociais e 11% para o Google. E na CNN a mesma relação era de 11% para mídias sociais e 9% para o Google. (4)
■ Publicar um blog e relacioná-lo ao seu site, com conteúdo (textos, imagens, vídeos, aúdios) que interesse ao seu público e o promova em mídias sociais, como Twitter, Facebook, para ganhar naturalmente links que possam aumentar o ranking de popularidade do site.
■ Preparar as URLs das páginas com palavras relacionadas ao conteúdo, para que os sites de busca liguem os assuntos ao endereço. Mas URLs muito longas dificultam a digitação e o arquivamento dos usuários e não são bem aceitas pelos buscadores.
■ Preparar o código HTML para a indexação. Se os arquivos CSS e de JavaScript ficam localizados em arquivos fora das páginas, a redução do tamanho do código de cada uma é razoável e favorece a sua indexação. Este aspecto recomendável, especialmente para a manutenção da acessibilidade do arquivo, mas não uma prioridade para buscas, a validação do código do site em relação aos padrões web.
■ Priorizar a usabilidade da interface, na medida em que ganham importância as conversões de acessos em vendas, o volume de cadastros, de compartilhamento de informações, bem como as taxas de rejeição, o tempo de permanência no site, a origem dos acessos, a taxa de retorno dos usuários, a reputação do site entre seus clientes, consumidores, seguidores.
■ Preparar a arquitetura da informação para a indexação. O conteúdo mais importante deve ficar localizado nas camadas superficiais, de modo que as aranhas dos buscadores o encontrem mais facilmente.
A navegação pelas principais páginas do site não deve exceder 3 ou 4 níveis. Sites mais "planos" facilitam o percursos das aranhas dos buscadores. Sites com muitas camadas e níveis mais profundos devem prover páginas em camadas intermediárias que publiquem as principais palavras-chave das páginas situadas em níveis mais profundos. (2)
A arquitetura é também crítica na medida em que os buscadores cada vez mais priorizam os caminhos dos usuários antes e depois de acessarem cada página ou site, de modo a personalizar os percursos para o perfil de cada usuário.
■ Aplicar títulos e nomes consistentes nas páginas e nos arquivos (imagens, PDFs, vídeos) - os sites de busca também levam estes termos em consideração para indexar conteúdo em diferentes formatos. ► Exemplo
■ Associar textos aos links que reflitam o conteúdo apontado. Os textos dos links ou textos-âncora (anchor text) são importante fator para a indexação dos buscadores.
■ Inserir meta informações sobre o conteúdo, como "robots", "keywords" e "description", mesmo que não sejam o principal fator indexador utilizado pelas ferramentas.
Aplicar também marcações para as páginas que não devem ser indexadas, como
<META NAME="robots" content="noindex, nofollow">.
■ Acompanhar as atualizações dos métodos e algoritmos dos buscadores, que mudam sempre (assim como a posição dos links no ranking de cada uma).
■ Preparar os links do site para indexação, mas evitar listas de links fora de contexto e marcações enganosas para forçar um ranking privilegiado nos resultados.
■ Publicar um mapa do site facilmente indexável (em modo texto) com os títulos e URLs da maioria das páginas ou das principais áreas de conteúdo.
■ Disponibilizar arquivos sitemap.xml, com informações sobre o site para os principais buscadores. Estes arquivos contêm listas de URLs e atributos que facilitam a indexação, complementando a varredura do conteúdo pelas "aranhas" dos sites. Proveem informações sobre as páginas a ser indexadas em caráter prioritário e as páginas atualizadas mais recentemente.
■ Disponibilizar um arquivo robots.txt, que avise aos sites de busca que diretórios de um site não devem ser indexados ou que agentes não devem indexar o site.
-> Por exemplo
User-agent: Googlebot
Disallow: /
User-agent: *
Disallow: cgi-bin
Disallow: imagens
Disallow: javascript
Disallow: estilos
Sitemap: http://www.nomedosite.com.br/sitemap.xml
O texto acima, exemplo de texto de um arquivo robots.txt, avisa ao agente de busca do Google (Googlebot) para não indexá-lo. E aos agentes de todas as ferramentas (*) a não indexar os diretórios "imagens", "javascript" e "estilos".
Na última linha, o protocolo Sitemap Autodiscovery permite que o sitemap na raiz de um site seja rastreado por todas os sites de busca sem necessidade de submeter o arquivo a cada uma.
■ Preparar os arquivos de vídeo e áudio com legendas e textos alternativos ("alt tags"). Preparar estes arquivos para a indexação, com descrições do conteúdo e informações de autoria e direitos de publicação
■ Preparar os arquivos em Flash com legendas e textos alternativos, pois muitos destes arquivos ainda são reconhecidos como imagem e os links são indexados de maneira muito simplificada.
O Google foi a primeira ferramenta de busca cujas aranhas examinaram arquivos de Flash (swf), no entanto ainda é preciso preparar os arquivos de maneira adequada para facilitar o seu acesso, de modo que que os textos sejam acessíveis e as URLs rastreadas. A publicação de textos alternativos, descrevendo o conteúdo dos arquivos, ainda é uma boa prática.
■ Aplicar normas de acessibilidade, que formatam o conteúdo para facilitar a sua indexação.
■ Em caso de uso de sistema de gerenciamento de conteúdo, verificar se o conteúdo é exportável, para permitir a sua indexação.
■ Aperfeiçoar continuamente o site para a indexação pelos buscadores, com base nas estatísticas de acesso, nas mudanças nos algoritmos das ferramentas, nos hábitos e demandas informacionais dos usuários. Este processo deve fazer parte dos processos regulares de gestão e manutenção do canal online.
■ Em caso de redesenho do site, prepará-lo para indexação pelos buscadores desde o planejamento do projeto até a produção das páginas.
Assuntos relacionados
► Gestão de marca online
► Extensão e a profundidade da estrutura
► Acessibilidade
► Gerenciamento dos arquivos
► Estatísticas do servidor (server logs)
Referências sobre SEO
► How search engines work, Mike Grehan (SearchEngineWatch, acesso em 11.1.2012)
5) Social signals & SEO: Focus on authority, de Eric Enge (SearchEngineWatch, acesso em 4.11.2011)
4) Search and rescue: How to become findable and shareable in social media, de Brian Solis (SearchEngineWatch, acesso em 7.4.2010)
3) As SERPs get more complicated, focus on relevant elements, de Chris Crum (WebProNews, acesso em 13.3.2010)
2) SEO e A.I. – Arquitetura da informação, de Frank Marcel (MestreSEO, acesso em 26.11.2009)
► Insights para busca (Google, acesso em 18.8.2009)
► No indexing guarantee from google flash crawls (acesso em 17.1.2007)
► Use sitemap standards to help search engines, de Tony Patton, sobre como sitemaps (TechRepublic, acesso em 5.12.2006)
1) Search engine indexing limits: Where do the bots stop?, de Serge Bondar (SitePoint, acesso em 4.5.2006)
Mais informação sobre SEO
► SEOBook’s SEO Toolbar – plug-in do Firefox que disponibiliza num botão dados sobre cada página navegada (acesso em 4.12.2011)
► Trendrr – permite o acompanhamento e a comparação de tendências em relação ao uso de palavras-chave (acesso em 21.5.2010)
► SEOChat, ferramentas de SEO (acesso em 3.5.2010)
► Xinu Returns – ferramenta que verifica o PageRank, Backlinks, número de páginas indexadas, rankings de sites em ferramentas de busca (acesso em 3.5.2010)
► Mestre SEO – ferramentas de SEO para assinantes (acesso em 3.5.2010)
► SEO Centro – Ferramentas de SEO (acesso em 3.5.2010)
► Mestre SEO – Tutorial de SEO (acesso em 3.5.2010)
► Web CEO Free Edition 6.5 – Programa freeware com informações sobre a classificação dos sites nos buscadores (acesso em 17.1.2007)
► Wordtracker – Programa que gera palavras-chaves (acesso em 17.1.2007)
► Search Engine Marketing Professional Organization – Organização sem fins lucrativos que promove a conscientização sobre a atividade e o valor das ferramentas de busca
Glossário
■ Relevância – Seleção de informações úteis, pertinentes para uma necessidade de informação. Um documento é relevante se contribui para satisfazer a necessidade de informação de um determinado usuário. É um termo bastante aplicado nas buscas online, que procuram situar os resultados mais relevantes no alto das listas de resultados.