Fonte:
Inovação Tecnológica. Data: 4/09/2012.
Informações
contextualizadas
Inspirados pelas
ideias propostas por um bibliotecário indiano há quase um século, uma equipe
europeia desenvolveu um novo sistema de buscas para a internet que leva em
conta fatores como opinião, contexto, tempo e localização.
A nova tecnologia,
que promete chegar ao mercado rapidamente, consegue mostrar tendências na
opinião pública sobre um determinado assunto, companhia ou pessoa, e como essa
tendência muda com o tempo.
A equipe do
projeto LivingKnowledge (conhecimento vivo, em tradução livre) acredita
que seus algoritmos permitirão até mesmo fazer previsões sobre o futuro.
"Faça uma
busca pela palavra 'clima' no Google, ou em outro motor de busca qualquer, e o
que você receberá de volta será basicamente uma lista de resultados que
caracterizam a palavra: não há categorização, nenhuma ordem específica, nenhum
contexto.
"Os motores
de busca atuais não levam em conta as dimensões da diversidade: fatores como
quando a informação foi publicada, se há uma tendência de favorecer uma ou
outra opinião, quem publicou e quando," explica Fausto Giunchiglia,
professor de ciência da computação na Universidade de Trento, na Itália.
Google da
diversidade
Mas será que a
tecnologia de buscas na internet poderá ser capaz de abarcar a diversidade?
Poderá um mecanismo de buscas dizer-lhe, por exemplo, como a opinião pública
sobre as mudanças climáticas mudaram na última década? Ou como a temperatura
poderá estar daqui a um século, agregando estimativas atuais e do passado a
partir de fontes diferentes?
Giunchiglia garante
que não apenas é possível, como isso já pode ser feito a partir dos resultados
do projeto.
Os pesquisadores
foram buscar inspiração no sistema de classificação de livros criado por
Sirkali Ramamrita Ranganathan nos anos 1930, que permite atribuir múltiplas
características a um livro, revista ou artigo.
Em vez de uma
posição taxonômica fixa, o sistema permite, por exemplo, que um texto sobre os
efeitos das mudanças climáticas na agricultura escrito no Brasil em 2010 seja
classificado como "Geografia; Clima; Mudança Climática; Agricultura;
Pesquisa; Brasil; 2010".
O que os
cientistas fizeram foi transformar o pseudo-algoritmo de Ranganathan em um
algoritmo codificado em um programa para minerar dados na internet.
Isso permite
extrair de cada texto um significado e um contexto, associando-lhe as chamadas
"facetas" da classificação bibliográfica. "E usar essas facetas
para estruturar a informação com base nas dimensões da diversidade,"
completa o professor Giunchiglia.
Conhecimento
aberto
O programa básico
será disponibilizado como software de código aberto, e vários parceiros do
projeto LivingKnowledge afirmaram que pretendem implementar a tecnologia
em produtos comerciais.
O professor
Giunchiglia, por sua vez, anunciou que pretende criar uma fundação sem fins lucrativos
para implementar os resultados do projeto, um de cada vez, conforme surjam
demandas para isso.
Nenhum comentário:
Postar um comentário