segunda-feira, 5 de maio de 2008

Sumários

Depois desta longa ausência de noticias, venho dar novidades.
Infelizmente ainda não há protótipo, devido ao facto de estar a tratar dos sumários, o que implica muita programação, no entanto, sem resultados "visíveis". Esta parte dos sumários é muito importante porque vai ser um dos contributos da minha tese, sendo uma grande parte da tese sobre este tema.
Nesta parte existe uma forte componente de clustering, que serve para a criação de grupos de informação e uma parte de Língua Natural, para a criação dos sumários. Actualmente, a parte do clustering já esta feita, encontrando-me neste momento na criação dos sumários.
Quando terminar esta parte volto a dar noticias :P.

terça-feira, 19 de fevereiro de 2008

Mais uma etapa

Depois de o Visualizer ter ficado para trás, agora é tempo de começar a aplicação da Tese.
Para já, ainda não existe nada com aspecto visual a não ser uns possíveis storyboadrs da aplicação, os quais se encontram abaixo.






O trabalho que tenho feito ao longo das ultimas 2 semanas dizem respeito aos sumários que vai ser necessário criar para a aplicação. Para tal, o que se usa é o clustering de documentos. Este clustering usa o algoritmo LSA, que permite encontrar documentos parecidos através das keywords que estes contenham, não sendo no entanto estritamente os documentos conterem as mesmas keywords. Estou a usar também o KNN para depois fazer os clusters, no entanto no que diz respeito a esta ultima parte, ainda não está completa, porque é necessário dizer quantos cluster são desejados. Ora como não sabemos quantos temas irão existir nos documentos, não podemos dizer quantos clusters são desejados. No entanto, este problema irá ser resolvido com um outro algoritmo de clustering, desenvolvido por João Mota (http://tfc-agrafo.blogspot.com/).
Fica a faltar a extracção das keywords mais significativas do tema.

segunda-feira, 21 de janeiro de 2008

Mais Visualizer ...

Depois desta longa ausência de noticias, muito devido ao fim das disciplinas do corrente semestre e respectivas avaliações e também as férias (as minhas na Suíça), aqui fica o estado do Visualizer. Os últimos tempos foram passados a integrar o OpenGL com o WX, o que deu algumas dores de cabeça e alguns problemas. De seguida passei para a implementação de várias funcionalidades para o programa, como é o caso da possibilidade de refinar a pesquisa através da selecção de query's. Para além disso implementei uma pesquisa com sugestões, como da para ver na figura. Tratei também da persistencia da aplicação, com a ajuda de XML, ficando guardado o estado do programa quando este se encerra, e carregando esse mesmo estado quando o programa arranca.
Falta terminar alguns pormenores na refinamento da pesquisa e a parte do picking que vai servir para seleccionar uma esfera e ver os respectivos detalhes (como por exemplo nome(s), tipo(s) do(s) ficheiro(s). Por fim, faltara "limar as arestas" da aplicação e tornar a aplicação "mais sexy" :).
Fica aqui o screenshot da aplicação.