De maneira simplificada, a expressão “web semântica” resume uma concepção estendida da web que valoriza mais o significado das informações do que a aparência das interfaces (sejam as páginas de um website na tela de um dispositivo ou aplicativos em smartphones, por exemplo).

A expressão é empregada em projeto desenvolvido desde 1998 por Tim Berners-Lee (um dos inventores da WWW) e o W3C, cujo objetivo é definir e associar dados disponíveis online para o aperfeiçoamento da automação, compartilhamento, integração e reutilização entre aplicativos e dispositivos.

A ideia básica do projeto consiste na criação de meta dados descrevendo os dados, de modo que os computadores possam processar seu significado e resolver problemas complexos de sentido de relacionamento entre dados.

Na web comum, as páginas compostas em HTML contêm meta-informações que são compreendidas pelo público mas não pelas máquinas.

Já na web semântica é possível constituir uma camada de tecnologia que, sem alterar a interface, permite a representação estrutural e semântica automatizada de informações.

As ferramentas de busca, por exemplo, não entendem as palavras-chave que os usuários digitam, são sistemas programados para buscar conjuntos de caracteres presentes nas páginas web.

Estes mecanismos nem sempre conseguem deduzir as associações que procuramos fazer com os termos que procuramos e ignorando as nuances das línguas humanas

A sequência de números 22241, por exemplo, pode significar um código postal, uma parte de um número telefônico, uma senha.

A busca por “Artesanato de Minas Gerais” retorna como resultado conjuntos de páginas que contêm as palavras “artesanato” e “Minas Gerais”, na medida em que a preposição “de” não é identificada, pois está presente em quase todas as páginas com textos na língua portuguesa.

A inteligência humana percebe que a estas mesmas informações se pode associar diferentes informações, mas um programa ou dispositivo não tem recursos para criar associações complexas.

A web semântica procura estabelecer maneiras de criar estas “associações múltiplas” para cada informação, tanto relativas a seu contexto quanto a seu significado, de modo que possam ser reconhecidas por diferentes tipos de dispositivos.

Assim, a catalogação de grandes volumes de informações e de estruturas de conhecimento pode ser automatizada com maior inteligência, não dependendo apenas da interferência humana.

Na medida em que cada computador entenda as características de cada usuário, cria uma representação destas características e pode rodar algoritmos para prover informações personalizadas. Ou seja, as preferências pessoais de cada um funcionam como filtros que influenciam os resultados de cada busca.

As informações em vez de listadas em estruturas hierárquicas podem se situar em rede (de pessoas, lugares, coisas), como no mundo real, sendo recombináveis de inúmeras maneiras.

A linguagem que reconhece a maneira como os dados se relacionam ao mundo real permite que uma pessoa ou máquina comece acessando um banco de dados e depois se desloque entre infinitas outras fontes, conectadas simplesmente pelo mesmo assunto.

As tecnologias mais importantes neste ambiente são a linguagem de marcação eXtensible Markup Language (XML) e a abordagem de representação de dados Resource Description Framework (RDF).

Estão em aperfeiçoamento também linguagens para representação da semântica de dados entre elas DAML+OIL e OWL explicitando restrições sobre a semântica do mundo real.

Aliadas a essa gama de linguagens, há também as ferramentas para manipulação das ontologias, a exemplo do OntoEdit, do Kaon e do Protegé entre outras (1).

Dentro destas perspectivas, a web será capaz de tecer uma rede extensa de conhecimento humano, podendo ainda, por meio do processamento via máquina, inferir novos conhecimentos. (Tim Bernes-Lee, 1) (Atualizado em 21.8.2012)

 

Referências

Getting started with semantic SEO (acesso em 21.8.2012)

An introduction to Tim Berners-Lee’s Semantic web (acesso em 3.7.2005)

Semantic web (W3C, acesso em 3.7.2005)

Next big step for the web – or a detour? (acesso em 3.7.2005)

1) Segundo Tim Berners-Lee, a web Semântica é uma extensão da web tradicional (acesso em 3.7.2005, não mais disponível no endereço acessado)

BBC World Cup 2010 dynamic semantic publishing, blog BBC Internet, acesso em 13.7.2010)

Linked data, web of data, and the semantic web (blog The semantic Abyss, acesso em 8.9.2009)

Filósofo cria língua universal para web e prevê nova revolução do conhecimento (G1, acesso em 31.8.2009)

Metadata for the masses (Adaptive Path, acesso em 10.1.2009, não mais disponível no endereço acessado)

MindSwap – Maryland Information and Network Dynamics Lab Semantic Web Agents Project (acesso em 29.8.2005)

Protegé – Editor para bases de conhecimento e ontologias (acesso em 3.7.2005)