As solicitações ao servidor web (server logs) geram dados sobre o site no momento em que cada página ou arquivo sob sua gestão é solicitado. Esses dados podem ser usados pelos gestores para conhecer os hábitos e comportamentos dos usuários.

De modo geral, um servidor web é um programa que atende às requisições dos usuários da web e permite o acesso, via browser, a páginas, imagens, sons, animações, filmes, scripts, arquivos CSS. A rigor deve prover respostas rápidas e precisas, a qualquer momento, a solicitações que chegam de diferentes origens.

Sua atividade, incluindo os problemas dela decorrentes, é relatada em arquivos (“server log files”). Programas como o Apache registram, entre muitas outras informações, o número de visitantes em um período de tempo, o número de bytes recebidos e enviados, o número de IP (internet Protocol) dos clientes, a data, o horário dos acessos.

O rastreamento dos acessos ao servidor é feito por programas de análise instalados no ambiente de hospedagem e seu acompanhamento regular permite a verificação de padrões de uso/ acesso e a realização de ações para aperfeiçoar a experiência de uso e o desempenho comercial do site. Seu uso apresenta vantagens e desvantagens.

Vantagens da coleta no servidor web

É de fácil implementação, pois as informações são recuperadas a partir da atividade do servidor

Facilita a discriminação do tipo de informação que se quer receber e usar, em detrimento de outras informações que podem ser descartadas.

Permite a entrada automática dos dados em bancos de dados que realizam filtragens pré-definidas.

Permite a verificação da atividade das diferentes ferramentas de busca e da efetividade das ações de preparo do site para indexação.

Provê a posse exclusiva dos dados gerados e consequentemente maior privacidade de seu uso.

Permite o rastreamento dos acessos em tempo real, sem diferença entre o tempo da verificação e o da publicação dos dados.

Disponibiliza os acessos ao site que resultaram em erro, seja por links interrompidos, páginas inexistentes.

Desvantagens da coleta no servidor web

O uso das ferramentas “avançar” e “recuar” do browser não é rastreado com precisão, pois os programas usam recursos de armazenar temporariamente os elementos das páginas (cache). Assim, páginas acessadas diversas vezes na mesma visita não são registradas com precisão.

O rastreamento preciso do endereço de IP de cada usuário é mais difícil, na medida em que este é gerado dinamicamente pelos provedores de acesso.

Algumas soluções não diferenciam bem os acessos das aranhas (dos buscadores) dos acessos dos usuário, o que faz com que muitos acessos automáticos sejam registrados como acessos de visitantes.

Ações realizadas em uma página depois do acesso dificilmente são rastreadas, inclusive o consumo de conteúdo interativo e URL de saída.

(Em caso de site publicado em diversos servidores web) Dificulta a sincronia dos acessos simultâneos e em diferentes fusos horários.

O gestor do site precisa considerar as vantagens e desvantagens dos relatórios de acesso gerados por servidores web em relação a outros modos de aferição, especialmente os modelos baseados na coleta de dados no browser dos usuários, com uso de JavaScript. Caso sejam necessários dados muito precisos para análise de acessos, pode ser feita o cruzamento dos dados gerados pelo servidor web com os dados gerados nos programas de acesso (browsers).

(Atualizado em 25.1.2012)

Referências

Google Analytics alternatives: Hosted vs. self-hosted solutions, Thom Craver (Search Engine Watch, acesso em 25.1.2012)

Livro: Web analitycs desmistified – a marketerás guide to understand how your website affects your business, de Eric T. Peterson. 2004