Indexação para busca na web

Preparo do site para indexação (SEO)

Algoritmos do Bing, Yahoo e outros buscadores

Atualizado em 14.3.2012

Para rastrear o conteúdo publicado online, os sites de busca enviam mecanismos automatizados, as "aranhas" (spiders), que indexam informações de cada domínio nos seus bancos de dados. Seus algoritmos, aperfeiçoados continuamente, estimam o valor de cada página e especificam a sua localização na ordem (ranking) de resultados.

Bing

Valoriza o texto dos links, mais do que os links em si. O número de links que apontam para um site é menos valorizado que no Google. (2)

Valoriza mais a idade do domínio que a frequência de atualização do conteúdo. (2)

Valoriza o conteúdo e a atualizade dos posts publicados em mídias sociais, especialmente no Twitter e no Facebook. Provê, nos resultados das buscas, informações sobre a popularidade de links em redes sociais. (1)

O critério de valorização de notícias passa fortemente pela atualidade do conteúdo e menos pela autoridade da organização ou pessoa que as publica. (3)

Valoriza links para/ de sites de boa reputação e considera a relevância do link para o conteúdo. Evitar textos escondidos no código, bem como comentários sem relevâncias em blogs.

Valoriza Javascript e CSS externos aos arquivos HTML.

Valoriza páginas leves.

Indexa os nomes dos arquivos e dos diretórios.

Limita a busca a diretórios mais superficiais.

Evita redirecionamentos de páginas via Javascript e meta refresh. Os redirecionamentos devem ser feitos via código 301.

Considera páginas de erro (404) adaptadas aos site.

Não valoriza estratégias de links muito agressivas (que criam subitamente muitos links para o mesmo site) ou link farms.

Yahoo

Valorizaa estrutura interna do código das páginas. Por isto, é importante verificar se as páginas são compatíveis com padrões web e se o conteúdo mais importante está situado nas partes iniciais do código. (2)

Na priorização do conteúdo, considera igualmente links internos e externos, embora os primeiros sejam menos confiáveis, pois podem conduzir a informação promocional.

Considera as páginas que mudaram de endereço ou foram "recicladas" por seus editores e perderam seu valor inicial.

Mantém fatores de cálculo que combatem o spam de links e não refletem apenas as preferências dos usuários, como o TrustRank.

Considera os links um a um, sem bloquear conjuntos de links com origem no mesmo servidor ou no mesmo domínio.

Ainda leva em conta as meta tags de cada página, embora estas sejam indiferentes para as aranhas do Google.

Em relação aos tamanhos dos textos indexados: segundo teste realizado por Serge Bondar (SitePoint, Search engine indexing limits: Where do the bots stop?, 28.4.2006), o Yahoo indexa textos com até 210Kb. Por isto, os trechos dos textos com as principais palavras-chave devem considerar estes limites.

Outros buscadores

O Inktomi considera as palavras-chaves como elementos de grande importância.

O site Alexa valoriza o volume de tráfico que o site recebe para avaliar a sua relevância para os usuários. O algoritmo Alexa Ratings estima o volume de acessos que cada site recebe e compara com o de outros sites relacionados.

Como o Yahoo, a MSN também considera as meta tags de cada página para a sua indexação.

O LiveSearch desvaloriza links interrompidos - File Not Found (404) - e URLs muito longas; considera as instruções do arquivo robot.txt, valoriza conteúdo em formatos como XML e PowerPoint, mas não considera arquivos em formato .exe (WebProNews, 8.2008)

 

Assuntos relacionados
Sobre a metatags
Preparo do site para indexação
Links e fraudes

Referências e fontes
3) 10 Keys to ranking on Google & Bing during breaking news events [Study] (SearchEngineWatch, acesso em 14.3.2012)
2) Optimizing for search engines other than Google, de Chris Crum (WebproNews, acesso em 4.12.2011)
Yahoo gets rid of 75,000 associated content articles, launches Yahoo Voices , de Chris Crum (WebproNews, acesso em 4.12.2011)
1) Search can't scale without social, and Bing has Facebook and Twitter on its side, de Jason Hiner (HTML Googies, acesso em 15.11.2011)
Powerful SEO content: Understanding breadth of coverage, de John Lynch (SearchEngineWatch, acesso em 21.5.2010)
SEO link building is just like business development, de Eric Enge (SearchEngineWatch, acesso em 18.5.2010)
Four new signals in search, de Eric Enge (SearchEngineWatch, acesso em 1.12.2009)
Link building for Bing rankings: Dos and don'ts, de Cris Crum (WebproNews, acesso em 23.11.2009)
Link building for smart webmasters (no dummies here) (SEM 101) (Bing Community, acesso em 23.11.2009)
Google and Bing tips for site architecture issues (WebProNews, acesso em 7.7.2009)

Glossário
Relevância – Seleção de informações úteis, pertinentes para uma necessidade de informação. Um documento é relevante se contribui para satisfazer a necessidade de informação de um determinado usuário. É um termo bastante aplicado nas buscas online, que procuram situar os resultados mais relevantes no alto das listas de resultados.

Avellar e Duarte no Twitter Avellar e Duarte no Facebook

Mapas temáticos
Buscas na web