Atualizado:17.10.2008
 
Projetos web
Publicação

Indexação para busca

 

Preparo do site para indexação (ou "otimização para buscadores")

O preparo de um site para os primeiros lugares dos resultados dos sites de busca é conhecido em português pela expressão "otimização para buscadores" (em inglês, SEO, "Search Engine Optimization"). Embora cada buscador desenvolva critérios próprios de indexação, algumas medidas de caráter geral melhoram o posicionamento no ranking das buscas orgânicas:

Publicar palavras-chaves e expressões familiares aos usuários.

Examinar os sites bem-sucedidos e seu vocabulário. Incluir nos textos tanto termos e expressões de uso genérico quanto específicos, como os de uma área de conhecimento ou de uma região geográfica.

-> Por exemplo, quando se pensa em cerveja, pode-se pensar tanto em marcas de fabricantes conhecidos ou em bares populares, como em assuntos próximos ("levedo", "futebol", "carnaval").

A presença das palavras-chave procuradas na página selecionada atende a quem procura a informação e estimula a navegação em outras páginas do mesmo site.

O uso de palavras-chave no plural inclui as pesquisas realizadas tanto com palavras no singular quanto no plural.

Palavras ou expressões criadas ou valorizadas para reforçar uma marca devem vir acompanhadas de outras, de uso generalizado, que o usuário lembre durante a busca.

-> Por exemplo, publicar na mesma página "portadores de deficiência física" e "deficientes físicos", pois ambas as expressões são usadas nas buscas.

No entanto, palavras-chave não devem ser utilizadas em excesso. As aranhas dos buscadores são programadas para ignorar sites com número excessivo destes termos e expressões, e seu uso pode ser prejudicial. De modo geral, pode-se trabalhar com a proporção de 2 a 6 palavras-chave para cada 200 palavras.

O Google disponibiliza uma ferramenta que ajuda a gerar palavras-chave e variações, a Ferramenta de palavras-chave, que opera em português e facilita a criação de anúncios para buscas.

Publicar palavras-chaves e expressões presentes nos sites da concorrência. O uso de palavras-chave muito comuns e de significado amplo sobre um assunto dificulta o posicionamento do site nas primeiras páginas de resultados, pois os termos precisam competir com muitos outros sites que as utilizam. O ideal é publicar termos e expressões incomuns em sites de conteúdo relacionado.

Inserir as palavras-chave mais importantes nos limites de indexação de textos dos buscadores mais importantes.

O Google indexa textos até o tamanho até 520kb; o Yahoo indexa textos até 210Kb; e o MSN até 1020Kb. (1)

Incluir nos títulos das páginas (title tags) palavras relevantes para as buscas.

Evitar repetir os títulos (title tags) das páginas, para justificar a publicação do conteúdo de cada uma.

Atualizar permanentemente o conteúdo.

Evitar repetir as meta tags das páginas.

Relacionar os textos dos links ao conteúdo das páginas para onde apontam. Substituir expressões sem informação, como "clique aqui" por expressões que expliquem o conteúdo. O link que explica o conteúdo da página para a qual aponta é uma boa fonte de informações para os sites de busca.

-> Por exemplo, em vez de "Clique aqui para algoritmos dos buscadores", o texto "Conheça os critérios de indexação dos algoritmos dos buscadores", com diferenciação de cor e uma seta ou marcador é mais eficaz.

Ou, em vez de....

"Calendários online são aplicativos muito úteis. Seus inúmeros recursos ajudam no dia-a-dia de trabalho e melhoram a produtividade. Saiba mais".

... é mais eficaz incluir o link dentro do texto:

"Calendários online são aplicativos muito úteis. Seus inúmeros recursos ajudam no dia-a-dia de trabalho e melhoram a produtividade."

Preparar o código HTML e a arquitetura da informação para a indexação. Se o código do site é compatível com os padrões web e os arquivos CSS e de JavaScript utilizados ficam localizados fora das páginas, a redução do tamanho do código é razoável e facilita a sua indexação.

Preparar a arquitetura da informação para a indexação. As informações mais importantes da estrutura devem ficar nas camadas mais superficiais, de modo que as aranhas dos buscadores encontrem mais facilmente as páginas e seu conteúdo. A navegação pelas principais páginas do site não deve exceder 3 ou 4 níveis. Sites mais "planos" facilitam o percursos das aranhas dos buscadores. Páginas em níveis mais profundos devem ficar vinculadas a outras páginas já indexadas.

Aplicar nomenclatura consistente nas páginas e arquivos (imagens, PDFs, vídeos) - os sites de busca consideram estes termos na indexação das informações. Exemplo

Preparar a URL da página com palavras relacionadas ao conteúdo, para que os sites de busca relacionem os assuntos ao endereço. Mas evitar URLs muito longas, pois são rejeitadas pelos buscadores.

Promover a publicação da URL em sites de parceiros, contatos, clientes, assinantes, sites de comunidades, redes sociais online, blogs. Ou promover a divulgação pelo boca-a-boca de colegas, amigos e parentes, estimulando a criação de links, para evidenciar a popularidade do site.

A publicação de artigos com o endereço e a participação em programas de afiliação também aumentam a visibilidade do endereço.

Inserir meta informações sobre o conteúdo, como "Robot", "Keywords" e "Description", mesmo que atualmente estas últimas não sejam o principal fator indexador utilizado pelas ferramentas.

Aplicar marcações para as páginas que não devem ser indexadas.

Acompanhar as atualizações dos métodos e algoritmos dos buscadores, que mudam sempre (assim como a posição dos links no ranking de cada uma).

Preparar os links do site para indexação, mas evitar listas de links fora de contexto e marcações enganosas para forçar um ranking privilegiado nos resultados.

Publicar um mapa do site facilmente indexável (em modo texto) com os títulos e URLs da maioria das páginas ou das principais áreas de conteúdo.

Disponibilizar arquivos sitemap.xml, com informações sobre o site para os principais buscadores. Estes arquivos contêm listas de URLs e atributos que facilitam a indexação, complementando a varredura do conteúdo pelas "aranhas" dos sites. Provêem informações sobre as páginas a ser indexadas em caráter prioritário e as páginas atualizadas mais recentemente.

-> Por exemplo:

<?xml version="1.0" encoding="UTF-8"?>
<urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.avellareduarte.com.br/</loc>
<lastmod>2008-1-14</lastmod>
</url>
</urlset>

O código acima informa que o endereço http://www.avellareduarte.com.br/ deve ser indexado. E que foi atualizado no dia 14 de janeiro de 2008.

A localização do arquivo sitemap.xml sinaliza as URLs incluídas no arquivo e fica a critério de cada webmaster: se for localizado na raiz do diretório do site, pode incluir todas as suas páginas; se for situado dentro de um diretório específico, seu escopo se restringe às páginas deste diretório.

O tamanho do arquivo não deve exceder 10 MB, embora possa ser compactado em formato.zip.

Em abril de 2007 as principais ferramentas de busca fizeram acordos sobre o formatos dos sitemaps. Para automatizar o seu reconhecimento, basta acrescentar uma linha de texto ao arquivo robots.txt (ver abaixo) para informar as aranhas sobre a localização do arquivo. Para mais informações, ver Sitemaps.org.

Disponibilizar um arquivo robots.txt, que avise aos sites de busca que diretórios de um site não devem ser indexados ou que agentes não devem indexar o site.

-> Por exemplo

User-agent: Googlebot
Disallow: /

User-agent: *
Disallow: cgi-bin
Disallow: imagens
Disallow: javascript
Disallow: estilos
Sitemap: http://www.nomedosite.com.br/sitemap.xml

O texto acima, exemplo de texto de um arquivo robots.txt, avisa ao agente de busca do Google (Googlebot) para não indexá-lo. E aos agentes de todas as ferramentas (*) a não indexar os diretórios "imagens", "javascript" e "estilos".

Na última linha, o protocolo Sitemap Autodiscovery permite que o sitemap na raiz de um site seja rastreado por todas os sites de busca sem necessidade de submeter o arquivo a cada uma.

Preparar os arquivos de vídeo e áudio com legendas e textos alternativos ("alt tags"). Preparar estes arquivos para a indexação, com descrições do conteúdo e informações de autoria e direitos de publicação

Preparar os arquivos em Flash com legendas e textos alternativos, pois muitos destes arquivos ainda são reconhecidos como imagem e os links são indexados de maneira muito simplificada.

O Google é a primeira ferramenta de busca cujas aranhas examinam arquivos de Flash (swf), no entanto é preciso preparar os arquivos de maneira adequada para facilitar o seu acesso, de modo que que os textos sejam acessíveis e as URLs rastreadas. A publicação de textos alternativos descrevendo o conteúdo dos arquivos ainda é uma boa prática.

Aplicar normas de acessibilidade, que formatam o conteúdo para facilitar a sua indexação.

Em caso de uso de sistema de gerenciamento de conteúdo, verificar se o conteúdo é exportável, para permitir a sua indexação.

Aperfeiçoar permanentemente o site para a indexação pelos buscadores, com base nas estatísticas de acesso, nas mudanças nos algoritmos das ferramentas, nos hábitos dos usuários. Este processo deve fazer parte dos processos regulares de gestão e manutenção do canal online.

Em caso de redesenho do site, prepará-lo para indexação pelos buscadores desde o planejamento do projeto até a produção das páginas.


Assuntos relacionados
Extensão e a profundidade da estrutura
Acessibilidade
Gerenciamento dos arquivos
Estatísticas do servidor (server logs)

Referências bibliográficas (Publicação de web site)
Secret benefits of search engine optimisation: increased usability (SitePoint, acesso em 7.8.2005)
Design your website to be search friendly (Builder.com, acesso em 7.8.2005)
Search engine marketing, Inc.:driving search traffic to your company's web site (WebReference, acesso em 13.8.2005)
1) Search engine indexing limits: Where do the bots stop? (SitePoint, acesso em 4.5.2006)
Use old words when writing for findability (UseIt, acesso em 1.9.2006)

Mais informação sobre o assunto (links externos)
Mestre SEO - Tutorial de SEO (acesso em 22.8.2008)
No indexing guarantee from google flash crawls (acesso em 17.1.2007)
Web CEO Free Edition 6.5 - Programa freeware que provê informações sobre um site e sua classificação nos buscadores. Permite a análise de site e da sua concorrência (acesso em 17.1.2007)
Wordtracker - Programa que gera palavras-chaves relacionadas às que os usuários submetem (acesso em 17.1.2007)
Search Engine Ranking Factors - Visão coletiva de 37 especialistas em preparo de sites para buscadores (acesso em 7.4.2007)
Diretrizes para webmasters - Informações do Google para otimizar sites (acesso em 13.3.2006)
Search Engine Marketing Professional Organization - Organização profissional sem fins lucrativos que promove a conscientização sobre a atividade e o valor das ferramentas de busca
Livro: Web marketing - usando ferramentas de busca, de Marcelo Silveira. Editora Novatec

Use sitemap standards to help search engines, de Tony Patton, sobre como os sitemaps informam os sites de busca sobre as páginas web que devem ser indexadas e as que foram atualizadas mais recentemente (TechRepublic, acesso em 5.12.2006)

Mapa
temático

Buscas na web


 ▲  
Alto