domingo, 21 de fevereiro de 2010

Sobre classificação da informação na web


Neste final de semana estava conversando com uma amiga (dentista) sobre o Garbage (uma banda de indie rock) e ela me dizia que não conseguia localizar no Google imagens muitas fotos da banda, pois quando realizava a busca apareciam mais fotos de lixo do que do grupo musical. Bem, expliquei a ela que isso é muito comum, pois o "garbage" é uma palavra em inglês cuja tradução literal é
"lixo", e também porque a internet ainda não possui um mecanismo efetivo que classifique em categorias todos os seus conteúdos. Daí que lembrei de um post interessantíssimo que li no blog Usabilidoido sobre classificação de conteúdo e ontologias, e partir disso tentei explicar pra ela como funciona essa questão de classificar e categorizar informção na internet.


Segundo o Frederick, dono do blog, os computadores precisam de categorias bem explícitas para discriminar as coisas, pois ao contrário de nós humanos que utilizamos categorias implíticas para nos comunicar e interagir, as máquinas não entendem os diversos sentidos que um termo pode atingir num determinado contexto.


O Fredereick utiliza como o exemplo o Edmundo, jogador de futebol, mais conhecido pela piadinha "Au au au, Edmundo é animal". Outro exemplo poderia ser também a Paris Hilton, Barbie girl assumida.




Nesse sentido, a categoria 'animal' numa aula de biologia é diferente da categoria 'animal' no futebol. Porém, o que existe neste caso é uma relação entre essas categorias. Observe que quando a torcida grita "Au au au, Edmundo é animal" ela não está categorizando o jogador Edmundo como um aninal (bicho), mas está sim referenciando-a. Note que se a torcida não tivesse um prévio conhecimento da categoria animal, o sentido da frase não seria o mesmo. A mesma explicação ocorre para o exemplo da Paris Hilton, já que Barbie é o nome de uma boneca e esse mesmo termo é utilizado para referenciar bonecas (artefato - brinquedo) em geral.

Nesse sentido, não é possível precisar o significado de um signo qualquer, pois ele não é único e seu significado vai depender da contexto social onde está a ser empregado.

A ciência da computação tentou resolver o problema da categorização por meio da criação de Ontologias. A proposta da criação de ontologias é a definição de categorias universais mais básicas e abrangentes, capazes de classificar tudo em esquemasm sem exceções. Entretanto, a criação de ontologias universais é algo utópico e, devido a isto, a nova proposta neste sentido é a criação de ontologias por áreas de conhecimento. Nesse sentido, a Web Semântica surge com a proposta de permitir ao próprio usuário classificar os conteúdos da web. Porém, ainda isso é uma atividade complexa de ser realizada.


Por exemplo, em que categoria classificar o Edmundo sem perder o sentido da piada? O mais correto seria categorizá-lo na categoria de esportes; no entanto, Frederick aponta que não é somente por meio da coerência que deve-se categorizar as coisas.

Nenhum comentário:

Postar um comentário

Pesquisar este blog

Seguidores