segunda-feira, 5 de maio de 2008

Sumários

Depois desta longa ausência de noticias, venho dar novidades.
Infelizmente ainda não há protótipo, devido ao facto de estar a tratar dos sumários, o que implica muita programação, no entanto, sem resultados "visíveis". Esta parte dos sumários é muito importante porque vai ser um dos contributos da minha tese, sendo uma grande parte da tese sobre este tema.
Nesta parte existe uma forte componente de clustering, que serve para a criação de grupos de informação e uma parte de Língua Natural, para a criação dos sumários. Actualmente, a parte do clustering já esta feita, encontrando-me neste momento na criação dos sumários.
Quando terminar esta parte volto a dar noticias :P.

terça-feira, 19 de fevereiro de 2008

Mais uma etapa

Depois de o Visualizer ter ficado para trás, agora é tempo de começar a aplicação da Tese.
Para já, ainda não existe nada com aspecto visual a não ser uns possíveis storyboadrs da aplicação, os quais se encontram abaixo.






O trabalho que tenho feito ao longo das ultimas 2 semanas dizem respeito aos sumários que vai ser necessário criar para a aplicação. Para tal, o que se usa é o clustering de documentos. Este clustering usa o algoritmo LSA, que permite encontrar documentos parecidos através das keywords que estes contenham, não sendo no entanto estritamente os documentos conterem as mesmas keywords. Estou a usar também o KNN para depois fazer os clusters, no entanto no que diz respeito a esta ultima parte, ainda não está completa, porque é necessário dizer quantos cluster são desejados. Ora como não sabemos quantos temas irão existir nos documentos, não podemos dizer quantos clusters são desejados. No entanto, este problema irá ser resolvido com um outro algoritmo de clustering, desenvolvido por João Mota (http://tfc-agrafo.blogspot.com/).
Fica a faltar a extracção das keywords mais significativas do tema.

segunda-feira, 21 de janeiro de 2008

Mais Visualizer ...

Depois desta longa ausência de noticias, muito devido ao fim das disciplinas do corrente semestre e respectivas avaliações e também as férias (as minhas na Suíça), aqui fica o estado do Visualizer. Os últimos tempos foram passados a integrar o OpenGL com o WX, o que deu algumas dores de cabeça e alguns problemas. De seguida passei para a implementação de várias funcionalidades para o programa, como é o caso da possibilidade de refinar a pesquisa através da selecção de query's. Para além disso implementei uma pesquisa com sugestões, como da para ver na figura. Tratei também da persistencia da aplicação, com a ajuda de XML, ficando guardado o estado do programa quando este se encerra, e carregando esse mesmo estado quando o programa arranca.
Falta terminar alguns pormenores na refinamento da pesquisa e a parte do picking que vai servir para seleccionar uma esfera e ver os respectivos detalhes (como por exemplo nome(s), tipo(s) do(s) ficheiro(s). Por fim, faltara "limar as arestas" da aplicação e tornar a aplicação "mais sexy" :).
Fica aqui o screenshot da aplicação.

terça-feira, 18 de dezembro de 2007

Visualizer com fuincionalidade

Bem, ao fim deste tempo todo de ausência, continuo a trabalhar na mesma aplicação. Isto justifica-se na medida em que tive as avaliações das disciplinas (desde testes, a projectos e acabando com apresentações) e ao imenso tempo perdido a "ambientar-me" ao pyOpenGL.
Neste momento o trabalho esta assim :)



A parte mais clara é a área de selecção, para depois se fazer zoom no tempo.

O passo seguinte passa por integrar o programa com wxWidgets, para desta forma lhe dar mais funcionalidade. Para além disso, vou melhorar um bocado a estética do que esta já feito, tratar da persistência, entre outros ... ou seja, ainda há muito trabalho.
Por agora é tudo.
Se tiverem sugestões, não hesitem.

segunda-feira, 12 de novembro de 2007

Estado do Visualizer

Devido ao problemas verificados no primeiro protótipo da aplicação, optei por dar um novo rumo ao programa, desenvolvendo a aplicação por partes, começando primeiro por pyOpenGL, e não por wxWidgets. Assim, supostamente, depois da parte do openGL estar completamente funcional, será só juntar o openGL com o wxPytohn, através do wxCanvas. Já tenho também uma amostra das "esferas" estando neste momento na duvida de qual escolher(ver figura abaixo). Ambos os casos simulam a existência de três tipos de documentos, através das três cores representadas. Se quiserem deixar uma opinião, são bem vidas :).

terça-feira, 30 de outubro de 2007

Visualizer


Depois do workshop de Quill/Scroll apresentou-se um novo trabalho, ao qual eu dei o titulo de Visualizer. O objectivo é, com uma simples aplicação em python com wxWidgets e OpenGL, construir uma aplicação a qual permita efectuar pesquisas sobre documentos, e o resultado destas seja apresentada ao longo do tempo, isto é, quando os documentos forma cridados/modificados/acedidos e a coesão desses mesmo documentos (ver figura acima).
Por enquanto a aplicação ainda vai no inicio, devido as grandes dificuldades sentidas na integração do python/wxWidgets/OpenGl.
Quando o Visualizer estiver pronto, apresentarei aqui os resultados :).

terça-feira, 23 de outubro de 2007

Mais uma etapa


Finalmente acabei e entreguei a ultima versão do o estado da arte (espero eu :P).
Também acabei a tal aplicação que era para fazer em python, cumprindo os objectivos desejados. No entanto pensei que fosse mais fácil criar interfaces com os wxWidgets, isto se calhar por estar habituado ao C# e ao visual studio. Acima fica um screenshot da aplicação desenvolvida.

Agora venha o workshop de quill/scroll :)