Indexação para busca na web

Preparo de site para buscas (SEO)

Atualizado em 10.4.2013

O preparo de um site para os primeiros lugares dos resultados das buscas, SEO, search engine optimization, ou otimização para buscadores, ajuda a melhorar o posicionamento no ranking de resultados. Ações estruturais incluem:

Definir as palavras e expressões mais importantes para os objetivos do site e verificar, nas estatísticas de acesso, as mais utilizadas (e importantes) nos buscadores pelos usuários. Valorizá-las nos textos para que sejam encontradas facilmente, inserindo-as no início dos textos. Incluir títulos (title tags) relevantes e únicos em cada página. Acompanhar as palavras-chave usadas na ferramenta de busca interna, para a verificar as necessidades de informações do público – no conteúdo e na estrutura de navegação.

Caso o site publique conteúdo em diversos idiomas, é importante verificar expressões regionais ou de segmento, evitando simplesmente traduzi-las a partir das palavras originais.

Deve-se evitar a repetiçãoexcessiva destas palavras, para não atrapalhar a leitura e a compreensão do texto. O Google cada vez mais aperfeiçoa os algoritmos para a percepção de sinônimos e expressões em língua natural. Por isto, não se deve dar importância absoluta a palavras-chave publicadas apenas para os buscadores, sem priorizar os interesses do público. (6)

Promover a publicação de URLs em sites de parceiros, contatos, clientes, assinantes, comunidades, redes sociais, blogs. E também a divulgação no boca-a-boca de colegas, amigos e parentes, que estimulam a criação de links e aumentam a popularidade do site. As mídias sociais têm cada vez mais importância nas buscas, pois reúnem a participação e a opinião de milhões de pessoas sobre diferentes sites e páginas web.

Os links não devem ir apenas para a página Principal, mas para as que têm relação direta com o conteúdo da páginas de saída.

A publicação de artigos em outros sites e a participação em programas de afiliação também aumentam a visibilidade da URL.

Atualizar permanentemente o conteúdo, para indicar que o site está em atividade e interessado em atender o seu público. O Google vem atualizando seus algoritmos continuamente para rastrear conteúdo recente (blogs, fórums e vídeo) e manter os resultados das buscas sintonizados com a publicação de conteúdo em tempo real. (6)

Atualizar permanentemente as referências ao site em mídias sociais, como Twitter, Facebook, Google+, valorizadas pelos buscadores como fonte de referência e informação para indexação em tempo real. A estratégia de palavras-chave também se extende estes a canais, bem como a emails e publicidade off-line.

O conjunto de citações, comentários, links destes sites para uma plataforma web compõe o seu posicionamento estratégico online. Likes no Facebook e +1s no Google podem não obrigatoriamente garantir bom ranking em resultado de busca mas aumentam visibilidade e valor da marca, e favorecem o posicionamento nas buscas. (5)

A Gigya empresa de otimização de sites para mídias sociais, verificou dados da Compete de novembro de 2009 e concluiu que algumas grandes empresas de mídia dos EUA se beneficiavam do efeito das redes sociais. O USA Today por exemplo, tinha 35% dos seus links de referência (referals) em mídias sociais e 6% no Google. Na People Magazine a proporção era de 23% para mídias sociais e 11% para o Google. E na CNN a mesma relação era de 11% para mídias sociais e 9% para o Google. (4)

Preparar as URLs das páginas com palavras relacionadas ao conteúdo, para que os sites de busca liguem os assuntos ao endereço. Mas URLs muito longas dificultam a digitação e o arquivamento dos usuários e não são bem aceitas pelos buscadores.

Preparar o código HTML para a indexação e rapidez de carregação. Se os arquivos CSS e de JavaScript ficam localizados em arquivos fora das páginas, a redução do tamanho do código de cada uma é razoável e favorece a sua indexação. Este aspecto recomendável, especialmente para a manutenção da acessibilidade do arquivo, mas não uma prioridade para buscas, a validação do código do site em relação aos padrões web.

Otilimizar a usabilidade da interface, na medida em que ganham importância as conversões de acessos em vendas, o volume de cadastros, de compartilhamento de informações, bem como as taxas de rejeição, o tempo de permanência no site, a origem dos acessos, a taxa de retorno dos usuários, a reputação do site entre seus clientes, consumidores, seguidores.

Preparar a arquitetura da informação para a indexação. O conteúdo mais importante deve ficar localizado nas camadas superficiais, de modo que as aranhas dos buscadores o encontrem mais facilmente.

A navegação pelas principais páginas do site não deve exceder 3 ou 4 níveis. Sites mais "planos" facilitam o percursos das aranhas dos buscadores. Sites com muitas camadas e níveis mais profundos devem prover páginas em camadas intermediárias que publiquem as principais palavras-chave das páginas situadas em níveis mais profundos. (2)

A arquitetura é também crítica na medida em que os buscadores cada vez mais priorizam os caminhos dos usuários antes e depois de acessarem cada página ou site, de modo a personalizar os percursos para o perfil de cada usuário.

Aplicar títulos e nomes consistentes nas páginas e nos arquivos (imagens, PDFs, vídeos) - os sites de busca também levam estes termos em consideração para indexar conteúdo em diferentes formatos. → Exemplo

Associar textos aos links que reflitam o conteúdo apontado. Os textos dos links ou textos-âncora (anchor text) são importante fator para a indexação dos buscadores.

Inserir meta informações sobre o conteúdo, como "robots", "keywords" e "description", mesmo que não sejam o principal fator indexador utilizado pelas ferramentas.

Aplicar também marcações para as páginas que não devem ser indexadas, como
<META NAME="robots" content="noindex, nofollow">.

Acompanhar as atualizações dos métodos e algoritmos dos buscadores, que mudam sempre (assim como a posição dos links no ranking de cada uma).

Preparar os links do site para indexação, mas evitar listas de links fora de contexto e marcações enganosas para forçar um ranking privilegiado nos resultados.

Publicar um mapa do site facilmente indexável (em modo texto) com os títulos e URLs da maioria das páginas ou das principais áreas de conteúdo.

Publicar arquivos sitemap.xml, com informações sobre o site para os principais buscadores. Estes arquivos contêm listas de URLs e atributos que facilitam a indexação, complementando a varredura do conteúdo pelas "aranhas" dos sites. Proveem informações sobre as páginas a ser indexadas em caráter prioritário e as páginas atualizadas mais recentemente.

Publicar arquivos robots.txt, que avisem aos sites de busca que diretórios de um site não devem ser indexados ou que agentes não devem indexar o site.

-> Por exemplo

User-agent: Googlebot
Disallow: /

User-agent: *
Disallow: cgi-bin
Disallow: imagens
Disallow: javascript
Disallow: estilos
Sitemap: http://www.nomedosite.com.br/sitemap.xml

O texto acima, exemplo de texto de um arquivo robots.txt, avisa ao agente de busca do Google (Googlebot) para não indexá-lo. E aos agentes de todas as ferramentas (*) a não indexar os diretórios "imagens", "javascript" e "estilos".

Na última linha, o protocolo Sitemap Autodiscovery permite que o sitemap na raiz de um site seja rastreado por todas os sites de busca sem necessidade de submeter o arquivo a cada uma.

Preparar os arquivos de vídeo e áudio com legendas e textos alternativos ("alt tags"), facilitando a indexação com descrições do conteúdo e informações de autoria e direitos de publicação

Preparar arquivos em Flash com legendas e textos alternativos, pois muitos são reconhecidos como imagem e os links são indexados de maneira muito simplificada.

O Google foi a primeira ferramenta de busca cujas aranhas examinaram arquivos de Flash (swf), no entanto ainda é preciso preparar os arquivos para facilitar o acesso, de modo que que os textos sejam acessíveis e as URLs rastreáveis. A publicação de textos alternativos, descrevendo o conteúdo dos arquivos, ainda é uma boa prática, embora estes arquivos sejam cada vez menos usados por sua incompatibilidade com dispositivos móveis da Apple.

Aplicar normas de acessibilidade, que formatam o conteúdo para facilitar a sua indexação.

Em caso de uso de sistema de gerenciamento de conteúdo, verificar se o conteúdo é exportável, para permitir a indexação.

Aperfeiçoar continuamente o site para a indexação pelos buscadores, com base nas estatísticas de acesso, em mudanças nos algoritmos das ferramentas, nos hábitos e demandas dos usuários. Este processo faz parte dos processos regulares de gestão e manutenção do canal online.

Em caso de redesenho, preparar o canal para indexação pelos buscadores desde o planejamento do projeto até o desenvolvimento das páginas.


Assuntos relacionados
Gestão de marca online
Extensão e a profundidade da estrutura
Estatísticas do servidor (server logs)
SEO para dispositivos móveis (mobile SEO)

Referências sobre SEO
The beginners guide to SEO, Mike Grehan (SEOMoz, acesso em 6.4.2013)
6) Google gets better at not having to send users to other sites, Chris Crum (WebProNews, acesso em 14.8.2012)
How search engines work, Mike Grehan (SearchEngineWatch, acesso em 11.1.2012)
5) Social signals & SEO: Focus on authority, Eric Enge (SearchEngineWatch, acesso em 4.11.2011)
4) Search and rescue: How to become findable and shareable in social media, de Brian Solis (SearchEngineWatch, acesso em 7.4.2010)
As SERPs get more complicated, focus on relevant elements, Chris Crum (WebProNews, acesso em 13.3.2010)
2) SEO e A.I. – Arquitetura da informação, Frank Marcel (MestreSEO, acesso em 26.11.2009)

Ferramentas relacionadas a SEO

SEMrush – Para a análise competitiva, lista as palavras que dirigem tráfego para um site, rankings de busca, dados de acesso. (acesso em 10.4.2013)
SEMrush – Para a análise competitiva, lista as palavras que dirigem tráfego para um site, rankings de busca, dados de acesso. (acesso em 10.4.2013)
Screaming Frog – Aplicativo baixável que rastreia links, imagens, CSS, scripts, apps de um site sob a perspectiva de otimização para buscadores. (acesso em 10.4.2013)
Screaming Frog – Aplicativo baixável que rastreia links, imagens, CSS, scripts, apps de um site sob a perspectiva de otimização para buscadores. (acesso em 10.4.2013)
Search Engine Optimization Toolkit – Aplicativo baixável com recomendações para sites amigáveis para a busca, com módulto de análise, módulo para avalização de sitemaps e robots.txt. (acesso em 10.4.2013)
SEOBook’s SEO Toolbar – plug-in do Firefox que disponibiliza num botão dados sobre cada página navegada (acesso em 4.12.2011)
Trends – permite o acompanhamento e a comparação de tendências em relação ao uso de palavras-chave (acesso em 21.5.2010)
SEOChat, ferramentas de SEO (acesso em 3.5.2010)
Xinu Returns – ferramenta que verifica o PageRank, Backlinks, número de páginas indexadas, rankings de sites em ferramentas de busca (acesso em 3.5.2010)
Mestre SEO – ferramentas de SEO para assinantes (acesso em 3.5.2010)
SEO Centro – Ferramentas de SEO (acesso em 3.5.2010)
Mestre SEO – Tutorial de SEO (acesso em 3.5.2010)
Web CEO Free Edition 6.5 – Programa freeware com informações sobre a classificação dos sites nos buscadores (acesso em 17.1.2007)
Wordtracker – Programa que gera palavras-chaves (acesso em 17.1.2007)

Glossário
Relevância – Seleção de informações úteis, pertinentes para uma necessidade de informação. Um documento é relevante se contribui para satisfazer a necessidade de informação de um determinado usuário. É um termo bastante aplicado nas buscas online, que procuram situar os resultados mais relevantes no alto das listas de resultados.

Avellar e Duarte no Twitter Avellar e Duarte no Facebook Feeds da Avellar e Duarte Avellar e Duarte no Delicious