SynExtract - extracção automática de relações de sinonímia para a aquisição eficiente de recursos lexicais
Objectivos gerais
extracção de relações de sinonímia a partir de dados não estruturados com vista a reduzir a intervenção humana na aquisição de recursos lexicais sem comprometer a sua precisão linguística. Dada a inexistência, ao contrário do que acontece com outras relações léxico-conceptuais, de padrões textuais claros que possam funcionar como pistas para a identificação de relações de sinonímia, um dos desafios deste projecto consiste na concepção de novas abordagens e metodologias:
explorar diferentes estratégias para medir a semelhança semântica entre palavras em corpora;
usar padrões léxico-sintácticos, ainda que residuais, para identificar relações de sinonímia;
filtrar resultados intermédios para reduzir o espaço de busca no contexto da identificação de relações de sinonímia;
avaliar a usabilidade de toda a informação obtida no processo de extracção de relações de sinonímia e equacionar a sua integração na base de dados da WordNet.PT.