O PageRank (nome baseado no do seu autor, Larry Page) é o conjunto de algoritmos usado pelo mecanismo de busca do Google para a indexação de páginas, aplicativos e arquivos online. Baseia-se na análise de links e na atribuição de pesos para cada elemento situado em arquivos aos quais os links estão relacionados. Quanto mais alto o peso do elemento, mais alto seu posicionamento no ranking de resultados de buscas.

  Compatibilidade de sites com dispositivos móveis, fator que passou a ter impacto significativo nos resultados de buscas partir de 2015, depois de um período em que o site enviou advertências aos webmasters para que corrigissem erros básicos de adaptabilidade.

Marcações “HREF” e “SRC” que apontam para páginas e arquivos, bem como o número de links para cada página – sob o ponto de vista quantitativo e qualitativo. Um link da página A para a página B é como um voto de A para B e afeta sua relevância. No entanto, links de sites com má reputação prejudicam a reputação do site para o qual apontam. Também a qualidade e a abrangência do conteúdo afetam os resultados das buscas. O número de links por página não deve passar de 100, pois afeta a qualidade da experiência do usuário.

Os textos dos links externos para um site também é considerado fator importante para o ranking. (6)

 Os interesses de cada usuário. A participação de cada pessoa na internet influencia os resultados das suas buscas, ou seja, os resultados ficam cada vez mais adaptados aos seus interesses, especialmente se são usuários cadastrados e logados. O Google usa como referência o histórico de buscas anteriores de cada IP. (2)

 Conteúdo de qualidade, compartilhável. Cada indivíduo representa uma oportunidade de apresentar conteúdo não só para uma, mas também para os seus círculos de relacionamento.

 Conteúdo atualizado com frequência. Eventos recentes (notícias, eventos recentes ou futuros), eventos regulares (anuais, de temporada, esportivos que ficam menos relevantes em pouco tempo), gírias ou termos podem ter importância em um momento e pouco depois são esquecidos (gírias, siglas). (8)

De qualquer modo, o critério de valorização de notícias passa também pela autoridade da organização ou pessoa que as publica. (11)

 A credibilidade do veículo para o público.

 Sites amigáveis para usuários de dispositivos móveis, na medida em que usuários poucas vezes retornam a sites que não funcionaram bem em celulares. Assim, sites ou plataformas que usam fontes de difícil leitura em telas pequenas, que demandam excessivo uso de zoom para a visualizar elementos, ou usam muitos recursos em Flash, tendem a ser desvalorizados. (12)

 Uma ampla e ativa base de membros em sites participativos e de mídias sociais, embora o Google conte com dados estimados – não tem acesso aos posts do Facebook e do Twitter – também valoriza as referências comerciais a uma empresa ou pessoa citadas nestas mídias, independentemente de terem links ou não.

 Domínios que publicam conteúdo semântica ou tematicamente consistente de conhecimento ou atividade. Quanto mais autoridade um site tem sobre um tema, maiores as chances de ser favorecido no ranking dos resultados para os termos de maior importância. O Google chama este alcance temático de “breath of coverage”, ou BOC. (7)

 “Title” tags adaptadas para cada página e a correta marcação de HTML nas páginas. No entanto, a equipe do Google reconhece que pode alterá-los nas páginas de resultados se considerá-los longos ou inadequados (como “Untitled”, por exemplo, ou títulos não relacionados ao conteúdo da página). (1)

 Relação direta entre os textos-âncora dos links e o conteúdo publicado nas páginas de destino. Se a repetição dos termos dos links for excessiva, pode apontar para uma estratégia de spam e o site é penalizado nas buscas.

 Ausência de estratégias agressivas de links cruzados por sites do mesmo dono. Essas estratégias também são diagnosticadas pela velocidade brusca com que o número de links para uma URL aumenta. Em ambos os casos, os sites envolvidos são desfavorecidos.

 Pouco conteúdo repetido no mesmo site ou em outros sites, com indexação de apenas uma versão, a que reconhece como canônica. O robot rastreia textos duplicados usados por webmasters que publicam conteúdo para diversas mídias. Para assinalar o conteúdo prioritário, as páginas secundárias devem ter marcações “noindex” e “nofollow” nas meta tags. (ver Sobre as meta tags)

Para sinalizar os links para o conteúdo prioritário, usar a tag rel=”canonical” na marcação.

Exemplo

<a href="https://www.avellareduarte.com.br/lançamento 3/lancamento3bd.htm" rel="canonical" >

Esse recurso é útil quando se está migrando de um domínio para outro e o servidor não oferece redirecionamento. Neste caso, é preciso publicar conteúdo duplicado durante algum tempo, para sinalizar a mudança ao público. (5)

Sites de comércio não devem repetir as descrições dos produtos criadas pelos fabricantes ou publicadas por outros site, pois podem ser penalizados com a má localização nas páginas de resultados de buscas (SERP – Search Engine Results Pages).

Sites com os mesmos textos publicados em diversos idiomas devem acrescentar tags que identifiquem a repetição, como

<link rel=”alternate” hreflang="english" href="https://www.avellareduarte.com.br/lançamento 3/lancamento3bd.htm" /> (9)

 Indexa textos publicados em arquivos em Flash e PDF, mas não favorece sites cuja navegação se baseie nessas plataformas. Em junho de 2010 a busca por “Pepsi” no Google não gera links secundários no resultado principal, apesar da importância comercial desta marca.

 Embora com imperfeições, indexa textos publicados como imagens. (1) O algoritmo considera também os textos de botões e textos associados a arquivos swf. (4)

Desvaloriza sites com altas taxas de visitas únicas com apenas uma página (bounce rates) – cada visita é considerada o número de páginas percorridas em um intervalo mínimo de 30 minutos, e se muitos usuários veem apenas uma página por visita sinalizam que o conteúdo pode não atender às suas necessidades. (3)

Ignora as meta “Keywords” no <head> do HTML.

 Considera o tempo de carregação das páginas nos browsers – o fator é importante na medida em que afeta diretamente a experiência dos usuários. Ver Page Speed, add-on para o Firefox/ Firebug que avalia o tempo de carregação das páginas.

Desvaloriza os sites que saturam as páginas com anúncios demais, também dentro da política de valorizar aqueles que proveem uma boa experiência aos usuários. (10)

Desvaloriza os sites que não têm muito conteúdo “acima da dobra”, o que também afeta a experiência do usuário (partindo do princípio de que os usuários, ao acessarem um site, querem ver log seu conteúdo.

 Pode demorar meses para registrar a mudança de uma URL. O PageRank muda sempre – em 2007 mudou 450 vezes. Um site que ocupa os primeiros lugares nos resultados em uma semana pode ocupar outra posição na semana seguinte. No entanto, embora as aranhas visitem a maioria dos sites em semanas, as URLs se mantêm por meses. Assim, se precisar mudar um endereço, considere esse tempo até a página recuperar seu ranking anterior.

Em relação aos tamanhos dos textos indexados, o Google, privilegia os textos com até 520KB, por isto, os trechos dos textos com as principais palavras-chave devem considerar estes limites.

(Atualizado em 14.4.2015)

 

Referências

11) It looks like Google Is adding another ranking signal (SearchEngineWatch, acesso em 14.10.2014)

11) 10 Keys to ranking on Google & Bing during breaking news events [Study] (SearchEngineWatch, acesso em 14.3.2012)

10) Google’s new page layout update targets sites with too many ads (SearchEngineWatch, acesso em 23.1.2012)

9) Unifying content under multilingual templates (Google Webmaster Central Blog, acesso em 23.12.2011)

8) Google discusses 10 recent algorithm changes, de Rob D. Young (Search Engine Watch, acesso em 17.11.2011)

7) Powerful SEO content: Understanding breadth of coverage, de John Lynch (SearchEngineWatch, acesso em 21.5.2010)

6) SEO link building is just like business development, de Eric Enge (SearchEngineWatch, acesso em 18.5.2010)

5) Duplicate content owners catch a new break from Google, de Chris Crum (SearchEngineWatch, acesso em 23.12.2009)

1) Google may change your page titles, de Chris Crum (WebProNews, acesso em 13.11.2009)

4) Google improves flash indexing capabilities, de Chris Crum (WebProNews, acesso em 23.6.2009)

3) Google answers bounce rate questions (WebProNews, acesso em 2.1.2009)

2) Will personal search turn SEO on its ear? (WebProNews, acesso em 23.12.2008)

Ferramenta

Google Webmaster Tools – Como o Googlebot interage com um website, inclui o registro de erros de rastreamento que pode afetar o ranqueamento de um site na ferramenta de busca

Termos utilizados

Relevância – Seleção de informações úteis, pertinentes para uma necessidade de informação. Um documento é relevante se contribui para satisfazer a necessidade de informação de um determinado usuário. É um termo bastante aplicado nas buscas online, que procuram situar os resultados mais relevantes no alto das listas de resultados.