SynExtract

SynExtract - extracção automática de relações de sinonímia para a aquisição eficiente de recursos lexicais

Concluído
Data
-
Referencia
SFRH/BPD/79900/2011
Instituição financiadora
FCT – Fundação para a Ciência e a Tecnologia

Objectivos gerais

 extracção de relações de sinonímia a partir de dados não estruturados com vista a reduzir a intervenção humana na aquisição de recursos lexicais sem comprometer a sua precisão linguística. Dada a inexistência, ao contrário do que acontece com outras relações léxico-conceptuais, de padrões textuais claros que possam funcionar como pistas para a identificação de relações de sinonímia, um dos desafios deste projecto consiste na concepção de novas abordagens e metodologias:
        explorar diferentes estratégias para medir a semelhança semântica entre palavras em corpora;
        usar padrões léxico-sintácticos, ainda que residuais, para identificar relações de sinonímia;
        filtrar resultados intermédios para reduzir o espaço de busca no contexto da identificação de relações de sinonímia;
        avaliar a usabilidade de toda a informação obtida no processo de extracção de relações de sinonímia e equacionar a sua integração na base de dados da WordNet.PT.

Parcerias
CLUL - Centro de Linguística da Universidade de Lisboa
Universitat Pompeu Fabra