Indexação para busca na web
Preparo do site para indexação (SEO)
Preparo do HTML (para indexação)
A maioria dos buscadores da web leva em conta, além da interface visível, o código HTML e a arquitetura da informação para calcular o grau de relevância dos elementos que compõem as páginas.
Informações localizadas nas camadas mais próximas à página principal são consideradas mais importantes do que as localizadas em camadas mais profundas. ► Exemplo
Títulos, links e botões localizados na parte superior da página também sinalizam os assuntos que merecem maior destaque.
Fatores a considerar no preparo do código das páginas web para buscas:
■ Incluir nos títulos das páginas <title tags> palavras relevantes para as buscas. Os títulos devem ser diferentes para cada página.
Os títulos são tão importantes que o Google se reserva o direito de alterá-los nas páginas de resultados se considerá-los muito longos ou inadequados (como "Untitled", por exemplo, ou títulos não relacionados ao conteúdo da página). (1)
■ Situar informações consistentes no alto da página (nome do domínio, título dos textos, nome do portal), que são as primeiras a ser indexadas.
Os títulos de cada texto devem ter explicações sobre o conteúdo - as primeiras posições do título devem conter palavras-chave de maior valor estratégico.
■ Os 2-3 primeiros Kb de texto de cada página são avaliados com mais rigor que o restante do texto - o cabeçalho da página e as primeiras linhas de texto são especialmente importantes para a indexação. O assunto mais importante de uma página normalmente está localizado (ou sinalizado) na sua área superior.
■ Incluir marcações descritivas de imagens ("alt") e links ("title"), que enriquecem a contextualização do conteúdo.
■ Usar CSS e marcações hierarquizadas de titulação (h1, h2, h3, etc.), que ajudam as "aranhas" dos sites de busca a estabelecer valores escalonados para o conteúdo mais importante de cada páginas. Este fator vem perdendo importância desde 2006.
■ Destacar a importância de textos com estilos bold e itálico.
■ Usar pouco ou não usar frames, que dificultam o estabelecimento de vínculos entre páginas.
■ Agrupar JavaScripts no final da página ou em arquivos externos (arquivos com a extensão “.js” - contêm o JavaScript, e apontam para a página HTML que os aplica).
Esta medida evita que muitas linhas de código no topo da página sejam indexadas com maior relevância que o texto dos primeiros parágrafos.
■ No caso das páginas ficarem ligadas entre si via JavaScript (com links não indexáveis), criar uma página com todos os links do site (ou os mais importantes) entre os arquivos do site no servidor.
As meta "robot" desta página específica devem indicar às ferramentas de busca para seguir os links que contém, mas não indexar a página em si (uso da marcação "no index, follow").
■ Avisar aos buscadores que URL de conteúdo duplicado deve ser indexada, publicando, na cabeça (<head>) do código de todas as páginas, a marcação:
<link rel=”canonical” href=”http://www.dominiodo site.com/conteudoPrincipal.htm” />
Desta forma, as aranhas identificam o conteúdo da URL canônica identificada como o que deve ser considerado.
■ Aperfeiçoar sempre o site para que fique cada vez mais amigável para os buscadores.
Assuntos relacionados
► Acessibilidade
► Sobre as meta tags
Referências (Publicação de web site)
1) Google may change your page titles, de Chris Crum (WebProNews, acesso em 13.11.2009)
► Canonical tag announced: Google's Matt Cutts interviewed, de Chris Crum (WebProNews, acesso em 20.2.2009)
► Secret benefits of search engine optimisation: Increased usability, de Trenton Moss (SitePoint, 15.11.2004)
► Googling the bottom line, de Adam L. Penenberg (Wired, 3.2.2005)
Mais informação sobre o assunto (links externos)
► Diretrizes para webmasters - Informações do Google para webmasters (acesso em 13.3.2006)
► Search Engine Marketing Professional Organization - organização profissional sem fins lucrativos dedicada a promover a conscientização sobre a atividade e o valor das ferramentas de busca
► Livro: Web marketing - usando ferramentas de busca, de Marcelo Silveira. Editora Novatec