Dependendo da etapa do projeto, testes de usabilidade podem ser realizados a partir de modelos em papel (para avaliar decisões estruturais), modelos conceituais (wireframes), interfaces em HTML, protótipos com ou sem o layout definido. Também podem ser realizados como parte da manutenção evolutiva do produto. O critério para a aplicação de cada técnica depende do grau de precisão dos resultados esperados, do tempo e dos recursos disponíveis (sempre menor do que o desejável) .
Durante a realização do projeto de produtos digitais, quanto mais rápidos os testes de rotina, maiores as chances de proverem informações úteis para o ajuste das interfaces. Podem ser feitos remotamente (online, em passo-a-passo de etapas sequenciadas) ou na presença de técnicos responsáveis por sua aplicação. Estudos comparativos mostram que os testes presenciais costumam evidenciar mais os problemas de usabilidade que os registrados nos testes remotos, sendo portanto mais completos. A presença de desenvolvedores, designers, arquitetos de informação nos testes ajuda a engajá-los nas questões críticas dos produtos e a propor soluções mais objetivas. Tanto os testes de usabilidade como seus critérios de avaliação são sempre únicos e variam de acordo com os objetivos e o escopo de cada site (e de cada aspecto testado). Os resultados obtidos não devem ser reutilizados em outro projeto.

Algumas técnicas utilizadas

Várias técnicas, métodos e práticas podem ser aplicadas em diversas etapas do projeto de mídia digital ou com o produto já no ar e variam de acordo com os objetivos da publicação: Teste não moderado – parte pesquisa, parte teste, em que na maioria dos casos um pequeno painel de controle flutua sobre a janela principal do browser, apresentando as tarefas e gerenciando o fluxo do teste. As vantagens deste tipo de teste são sua facilidade de alcançar grandes grupos de participantes, o que facilita a realização de avaliações quantitativas do tempo de duração de algumas tarefas e a taxa de sucesso na sua realização (ver algumas ferramentas no pé deste texto). Design participativo – comum no projeto de intranets, inclui um ou mais representantes do público-alvo no próprio projeto, para manter nos usuários o foco do desenvolvimento. Este modelo leva em conta desde informações genéricas (como dados demográficos dos usuários), como também as reações e opiniões pessoais. Os participantes mantêm alguma distância dos processos operacionais do projeto, para evitar que acabem estabelecendo cumplicidades com a equipe e atrapalhem a neutralidade das suas interferências.
Em 2011, a Etsy criou múltiplas plataformas de testes e pediu aos próprios usuários para darem retorno sobre as soluções. No início do 2015, tinha em torno de 50.000 colaboradores ativos. (ReadWrite, 8.2.15)
Card sorting – método simples e barato em que cartões de papel escritos são apresentados aos usuários para que os organizem segundo seu modelos mentais. Ajuda a criar taxonomias, percursos de navegação, menus, estruturas gerais. Pode ser realizado presencial ou remotamente. Pesquisa com grupos focais – realizada mais frequentemente na etapa da conceituação, permite o detalhamento das características do público-alvo do website e a consideração em profundidade de opiniões, percepções, sentimentos observados ou relatados. Seu objetivo é identificar se os conceitos básicos do projeto estão claros para o público. Protótipo em papel – o usuário é apresentado a alguns aspectos, representados em papel, do produto digital em projeto e a partir daí, responde a perguntas sobre sua organização, layout, ou como faria determinada ação em uma interface com aquelas características. Tem a vantagem de que muitas informações importantes podem ser coletadas rapidamente, a custos muito baixos, antes de qualquer programação.

Protótipos de papel também podem ser apresentados como páginas de rascunho com proposições bem simples, e chamadas muito claras para ação. Chegar a esboços de tela simplificados que realmente reflitam uma solução ao problema a resolver não é tão simples como parece, e deve ser aperfeiçoado ao máximo. Propõe-se ao usuário que olhe a tela esboçada por cinco segundos e, em seguida, depois de retirá-la de vista, e faz-se uma série de perguntas, como “para que serve isso?” ou “o que faria com este produto?”, “qual é o próximo passo?” E verifica-se se a resposta recebida é a esperada ou não.

Protótipo funcional ou com percurso estruturado – parece o software a ser desenvolvido, é mais tangível que o protótipo de papel, o que faz com que as pessoas interajam mais naturalmente com a interface. Permite acompanhar o deslocamento dos usuários do produto digital, ou entre produtos, a partir de tarefas estabelecidas pelo moderador. Funciona bem para avaliar a usabilidade do produto, mas não tão bem para avaliar a motivação de uso, na medida em que não se parece visualmente com o resultado final. Testes com protótipos devem ser feitos a partir de histórias de usuários (user stories) resultantes de pesquisas que mapeiem suas ações quando for usar o produto, sua recompensa depois do uso e como este uso pode vir a ser recorrente (Hook Framework). Pesquisas de opinião – também realizadas nas etapas inicias do projeto, são aplicadas para o conhecimento das preferências e hábitos de uma base maior de usuários sobre um produto. Seus resultados são genéricos, mas permitem a tomada de decisões sobre as características de caráter mais estratégico da mídia digital. Avaliação heurística, ou de especialistas – realizada por um ou mais especialistas em interação humano-computador não diretamente envolvidos no projeto, leva em conta metodologias ou listas de referência amplamente aceitas para examinar a documentação do projeto e o programa. Gera um relatório ou lista de problemas, às vezes com recomendações para serem aplicadas no aperfeiçoamento do produto. Auditoria de usabilidade – exame analítico que segue o desenvolvimento da mídia digital, submetendo os resultados parciais a listas de checagem, padrões amplamente aceitos pela indústria ou padrões estabelecidos a partir de projetos de mesma natureza realizados anteriormente pela organização. (Ver Indicadores de qualidade – exemplo de lista de checagem). Teste de usabilidade – emprega diversas técnicas para a coleta de dados empíricos durante a realização de tarefas na mídia digital por representantes do público-alvo. Há testes mais ou menos formais. Os testes formais são conduzidos de modo a gerar dados que confirmem ou refutem hipóteses sobre a interface. São realizados em instalações preparadas com esta finalidade, com equipamentos de gravação e layout que facilitam a visualização das ações dos usuários não só por quem está diretamente envolvido nos testes como pela equipe de designers, desenvolvedores, analistas de negócios, gestores de projetos. Já testes mais informais, que tendem a ser realizados ao longo de todo o desenvolvimento, permitem o aperfeiçoamento gradual do produto em projeto. Estudos de campo (testes alfa ou beta) – estudo da interface em lugar semelhante ao do uso regular da interface em teste, como uma residência, um escritório, café, carro (no caso de testes com dispositivos móveis). Coleta-se dados que permitem o aperfeiçoamento da mídia digital, como padrões de uso, dificuldades, improvisos e atitudes. Como precisam ser realizados já em etapas de fechamento do projeto, não resultam em mudanças estruturais. (2)
O YouTube em 2009 realizou diversos testes em campo para verificar como aumentar o número de registros. Com a mudança de 3 detalhes da interface o número de cadastros aumentou 15,7%. (3)
Testes remotos – usando tecnologias como Skype, permitem que os avaliadores entrem em contato com pessoas localizadas fora de sua área de atuação direta ou de difícil acesso. Podem ser moderados ou não, os usuários realizam tarefas, suas ações são gravadas e as seções são enviadas para local em que a equipe possa examiná-los. O tipo de teste a ser aplicado depende dos objetivos de negócios da empresa, da etapa do projeto em que são realizados, dos resultados esperados (verificar uma funcionalidade-chave, por exemplo). Sessões personalizadas permitem o conhecimento mais aprofundado de perfis e atitudes; pesquisas baseadas em dados quantitativos ajudam a tomada de decisão em mídias de grande audiência. O ideal é, no dia a dia, combinar diversos métodos, de acordo com a situação que se precisa avaliar. Apesar da sua importância, os resultados dos testes de usabilidade não são incontestáveis. Outros tipos de estudos realizados antes e depois do lançamento do canal favorecem o aperfeiçoamento gradual, como entrevistas, pesquisas de opinião ou análises de estatísticas de acesso que coletem dados sobre o produto em seus contextos de uso. Estes dados, em conjunto com dados financeiros (em caso de site de comércio), dados da equipe de suporte ao público, permitem avaliações realistas do veículo e ajudam a compor uma perspectiva ampla da opinião e das ações dos usuários. Se por um lado a popularidade de um canal digital não informa se é funcional e adequado aos usuários, por outro a boa usabilidade pode não se mostrar suficiente para garantir a audiência ou as vendas esperadas em um site de comércio, por exemplo. A boa receptividade do canal pelo público é resultado de uma série de fatores combinados, não só relacionados à sua usabilidade, a serem examinados separadamente, para permitir o controle e o ajuste adequado de cada um. (Texto publicado em 14.9.2008. Atualizado em 9.12.2017)
 

Referências

The three lenses of usability evaluationDavid Travis (Userfocus, acesso em 1.10.2012) How to run an unmoderated usability test, de David Travis (acesso em 1.10.2012) 3) Look inside a 1,024 recipe multivariate experiment (YouTube, acesso em 27.12.2009) 2) Livro: Handbook of usability testing – How to plan, design and conduct effective tests, de Jeffrey Rubin. New York: Wiley, 1994. Livro: Prioritizing web usability, de Jakob Nielsen e Hoa Loranger. New York: New Riders, 2006 Risks of quantitative studies, de Jakob Nielsen (AlertBox, acesso em 26.8.2005) Involving stakeholders in user testing (Alertbox, acesso em 25.5.2010) Search experiments, large and small (The Official Google Blog, acesso em 27.7.2009, publicado em 26.8.2008) Guesses vs. data as basis for design recommendations (Alertbox, 8.6.2009) Usability.net – Methods table Ten usability heuristics de Cláudia Dias, extraído de sua dissertação de mestrado (acesso em 2.11.2008) Agile development projects and usability (AlertBox, acesso em 17.11.2007) Should designers and developers do usability? (AlertBox, acesso em 28.6.2007) Fast, cheap, and good: Yes, you can have it all, de Jakob Nielsen, sobre a relação entre preço, qualidade e tempo de realização de testes de usuários (AlertBox, acesso em 2.1.2007)  

Ferramentas para testes de usabilidade

Optimal Workshop, para a realização de card sorting. Oferece as cartas a serem preenchidas, o ambiente de organização para os usuários, as perguntas a serem aplicadas, e mesmo ferramentas para recrutamento de participantes por email (acesso em 16.4.2015) What users do, para a coleta de dados com gravação de vídeo em tempo real, para sites, apps ou protótipos (acesso em 16.4.2015) Verify, para a coleta de dados em tempo real, para análise demográfica, a partir de qualquer dispositivo (acesso em 16.4.2015) Loop11, para a realização de testes de usabilidade remotos a partir do endereço web fornecido (acesso em 16.4.2015) Inspectlet, captura as ações como cliques, rolagem, mudanças de página, incluindo “mapas de temperatura”. Assinatura a partir de $39,00, com plano limitado gratuito (acesso em 9.4.2015) FullStory, também para a captura das ações dos usuários e a compreensão do comportamento em contexto das tarefas. Assinatura mensal a partir de $149 (acesso em 9.4.2015) Project, desenvolvida pela empresa Revelation para a realização de pesquisas qualitativas de usuários e testes conceituais (acesso em 18.12.2011) User Testing, permite a escolha de usuários com determinados perfis demográficos, como gênero, idade, renda, país, experiência na internet. As tarefas são indicadas aos usuários e as ações são gravadas em vídeo (com áudio) – US $ 39,00 para cada teste (acesso em 28.3.2010) Feedback Army, provê agilidade e flexibilidade para aplicar questionários, as respostas de cada usuário são apresentadas em um conjunto de respostas numeradas – US $ 10,00 para cada teste (acesso em 28.3.2010) Silverback, aplicativo para Mac que pode gravar a tela do computador e vídeos e áudios do iChat, gravar as reações dos usuários (com áudio), controle remoto das gravações, que podem ser exportadas em QuickTime – US $ 50,00 (acesso em 28.3.2010) Morae, pacote de alto nível com suporte para trabalho em equipe, relatórios detalhados, estudos de campo, protótipos de papel, testes de dispositivos móveis – US $ 1.500,00 (acesso em 28.3.2010)