Para rastrear o conteúdo publicado online, as ferramentas de busca enviam mecanismos automatizados, ou “aranhas” (spiders), que indexam informações de cada domínio em seus bancos de dados. Os algoritmos, aperfeiçoados continuamente, estimam o valor de cada página e especificam sua localização na ordem (ranking) de resultados. Os critérios de indexação do Bing, do Yahoo e de outros buscadores têm algumas especificidades.

Bing

Em 2015, começou a indexar o conteúdo de aplicativos, com apropriação do vocabulário das marcações Schema, tanto para iOS quanto para Android. A ferramenta estimula desenvolvedores a modificar os links e as marcações. Também funcionalidades e conteúdo do Windows 10 selecionado poderá vir a ser indexado (4)

Valoriza o texto dos links, mais do que os links em si. O número de links que apontam para um site é menos valorizado que no Google. (2)

Valoriza mais a idade do domínio que a frequência de atualização do conteúdo. (2)

Valoriza o conteúdo e a atualizade dos posts publicados em mídias sociais, especialmente no Twitter e no Facebook. Provê, nos resultados das buscas, informações sobre a popularidade de links em redes sociais. (1)

O critério de valorização de notícias passa mais pela atualidade do conteúdo e menos pela autoridade da organização ou pessoa que as publica. (3)

Valoriza links para/de sites de boa reputação e considera a relevância do link para o conteúdo. Por issso, evitar textos escondidos no código, bem como comentários sem relevâncias em blogs.

Valoriza Javascript e CSS externos aos arquivos HTML.

Valoriza páginas leves.

Indexa tanto os nomes dos arquivos e quanto dos diretórios.

Limita a busca a diretórios mais superficiais.

Evita redirecionamentos de páginas via Javascript e meta refresh. Os redirecionamentos devem ser feitos via código 301.

Considera páginas de erro (404) adaptadas aos sites.

Não valoriza estratégias de links muito agressivas (que criam subitamente muitos links para o mesmo site) ou link farms.

Valoriza títulos de página (title tags) descritivos do conteúdo, em detrimento de títulos genéricos, como “Home”, ou “Principal”. Títulos longos não são bem-vindos, bem como títulos repetidos em diversas páginas.

Yahoo

Valoriza a estrutura interna do código das páginas. Por isto, é importante verificar se as páginas são compatíveis com padrões web e se o conteúdo mais importante está situado nas partes iniciais do código. (2)

Na priorização do conteúdo, considera igualmente links internos e externos, embora os primeiros sejam menos confiáveis, pois podem conduzir a informação promocional.

Considera as páginas que mudaram de endereço ou foram “recicladas” por seus editores e perderam seu valor inicial.

Mantém fatores de cálculo que combatem o spam de links e não refletem apenas as preferências dos usuários, como o TrustRank.

Considera os links um a um, sem bloquear conjuntos de links com origem no mesmo servidor ou no mesmo domínio.

Ainda leva em conta as meta tags de cada página, embora essas sejam indiferentes para as aranhas do Google.

Outros buscadores

O Inktomi considera as palavras-chaves como elementos de grande importância.

O Alexa valoriza o volume de tráfico que o site recebe para avaliar sua relevância. O algoritmo Alexa Ratings estima o volume de acessos que cada site recebe e compara com o de outros sites relacionados.

Como o Yahoo, a MSN também considera as meta tags de cada página para sua indexação.

O LiveSearch desvaloriza links interrompidos – File Not Found (404) – e URLs muito longas; considera as instruções do arquivo robot.txt, valoriza conteúdo em formatos como XML e PowerPoint, mas não considera arquivos em formato .exe (WebProNews, 8.2008)

(Atualizado em 23.5.2015)

 

Referências

4) Bing begins indexing apps by content rather than title, Emily Alford (SearchEngineWatch, acesso em 23.5.2015)

How Bing chooses your webpage titles, John Gagnon (SearchEngineWatch, acesso em 2.7.2014)

3) 10 Keys to ranking on Google & Bing during breaking news events [Study] (SearchEngineWatch, acesso em 14.3.2012)

2) Optimizing for search engines other than Google, Chris Crum (WebproNews, acesso em 4.12.2011)

1) Search can’t scale without social, and Bing has Facebook and Twitter on its side, Jason Hiner (HTML Googies, acesso em 15.11.2011)

Termos utilizados

Relevância – Seleção de informações úteis, pertinentes para uma necessidade de informação. Um documento é relevante se contribui para satisfazer a necessidade de informação de um determinado usuário. É um termo bastante aplicado nas buscas online, que procuram situar os resultados mais relevantes no alto das listas de resultados.