Grammar & Resources

The group is centered on modeling linguistic knowledge, integrating interfaces between different areas of grammar and knowledge about how language is put to use. Joint work in formal phonology, lexicon, syntax and semantics allows building an integrated model of grammar, considering how it is represented in the human mind, as well as how it can be computationally modelled; work on L1 and L2 acquisition is at the core of this work. The integration of models of language representation and models of language use is achieved through the study of corpora.

The production of corpora and resources is justified by the goal of developing documentation and providing descriptions of contemporary European Portuguese, but also of understudied contact languages or varieties (Portuguese-based creoles, national varieties of Portuguese in Africa and Asia). The group also produces resources for the study of L1 and L2 acquisition in different settings. The group integrates CLARIN LP.

Research on L1 and L2 acquisition contributes to CLUL’s general purpose of effectively articulating fundamental and applied research, namely in the areas of Educational Linguistics and Clinical Linguistics.

General goals:

- To produce new resources for the study of Portuguese and Portuguese-based creoles;

- To pursue basic research on natural language modeling, integrating knowledge on interfaces between language modules;

- To continue the documentation and description of understudied creoles and new varieties of Portuguese that emerged in a context of language contact;

- To develop the study of language acquisition with an emphasis on language contact situations (see new international Heritage Language Consortium) and on the comparison between typical and atypical development;

- To explore the potential of comparative linguistics in the production of resources for translation and to promote connections with the industry in the area of translation.

 

Resources Type
A Lexicon of Child European Portuguese - CEPLEXicon Lexicon
A Portuguese Native Language Identification Dataset - NLI-PT Database
Acquisition of European Portuguese Databank - AcEP Database
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Database
Consonantic Sequences Oral and Written Production Tasks - PORESC Tool
Controlled Portuguese - CLG Database
Corpora of PLE Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus of Cape Verdean Portuguese Corpus
Corpus of Sri Lanka Portuguese Corpus
Corpus of the Diaries of the Portuguese Parliament annotated with PoS - PTPARL Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - European Portuguese Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Tool
Dados Orais de Cabo Verde - CV Words Database
Demo de Subespecificação e Desambiguação de Escopo Tool
Dictionary of Hindi-Portuguese-Hindi Database
Diu Indo-Portuguese Data Set Database
Learner Corpus of Portuguese L2 - COPLE2 Corpus
LT Corpus (Literary Corpus) - LT Corpus Corpus
Modality Lexicon - MODAL-LEX-PT Lexicon
Multifunctional Computational Lexicon of Contemporary Portuguese Lexicon
Named Entity Recognizer - CRPC-NER Tool
Nominal Multiword Lexical Units in European Portuguese Lexicon
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Corpus of Writing and Speech of Children in the Early Years of Schooling - EFFE-On Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Database
Pereira&Freitas - EP Corpus
Person-Machine Interaction in Natural Language - INQUER Database
PhonoDis Corpus
Phonological Awareness Tasks for First Grade School Children - TCFC Tool
Portuguese Biographies - Bio-PT Database
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Lexicon
Portuguese Technical Lexica - LEXTEC Lexicon
Portuguese Discourse Bank - CRPC-DB Corpus
Quotations database - CRPC-quotations Database
Ramalho – EP Corpus
Reference Corpus of Contemporary Portuguese - CRPC Corpus
Santome Structure Dataset Database
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Spoken Portuguese - Geographical and Social Varieties Corpus
Vocatives in European Portuguese Corpus
Word Combination in European Portuguese - LEX-MWE-PT Lexicon
WordNet.PT Lexicon
Capítulo de Livro
Peres, J. A., Móia, T., & Marques, R. (1999). Sobre a Forma e o Sentido das Orações Condicionais em Português. In Lindley Cintra. Homenagem ao Homem, ao Mestre e ao Cidadão (I. H. Faria, org. , pp. 627-653). Lisboa: Edições Cosmos / Faculdade de Letras da Universidade de Lisboa.
pdf775.42 KB
Mata, A. I., & Neves, B. (2012). A mulher que prendeu a chuva. In (pp. 93-108). - leituras entrecruzadas, in Nada na Linguagem lhe é Estranho. Homenagem a Isabel Hub Faria.
Moniz, H., Batista, F., Trancoso, I., & Mata, A. I. (2011). Analysis of interrogatives in different domains. In Towards Autonomous (Adaptive and Context-Aware Multimodal Interfaces: Theoretical and Practical Issues, pp. 136-148). A. Esposito, A. M. Esposito, R. Martone, V. C. Müller & G. Scarpetta. Berlin / Heidelberg: Springer.
Moniz, H., Trancoso, I., & Mata, A. I. (2010). Disfluencies and the perspective of prosodic fluency, in Development of Multimodal Interfaces: Active Listening and Synchrony. In (pp. 382-396). Esposito, N. Campbell, C. Vogel, A. Hussain & A. Nijholt. Berlin / Heidelberg: Springer.
Mata, A. I. (2006). Impressões digitais: linhas de identificação de um professor de língua portuguesa, in Ensino do Português para o Século XXI. In (pp. 83-97). Duarte & P. Morão. Lisbon: FLUL/Edições Colibri.
Mata, A. I. (1992). É só ouvir.. In (pp. 45-74). M. R. Delgado-Martins, D. Ramos Pereira, A. I. Mata, M. A. Costa, L. Prista & I. Duarte. Lisbon: Colibri.
Mata, A. I. (1992). Questões de Entoação e Interrogação em Português. In (pp. 33-73). I. Pereira, A. I. Mata & M. J. Freitas. Lisbon: Colibri.
Mata, A. I., & Pereira, R. (1991). Natureza, aquisição e aprendizagem do conhecimento linguístico, in Ensino-Aprendizagem da Língua Portuguesa. In (pp. 61-86). Barbeiro, E. Fonseca, C. Nobre & E. Machado. Leiria: E.S.E.
Mata, A. I. (1991). Ensino da gramática: uma caracterização, in Documentos do Encontro sobre os Novos Programas de Português. In (pp. 81-115). Delgado-Martins, I. Duarte, A. Costa, D. Ramos Pereira, L. Prista & A. I. Mata. Lisbon: Colibri.
Cabarrão, V., & Mata, A. I. (2014). Constituintes afirmativos em Português Europeu: propriedades prosódicas e discursivas. In Textos Selecionados do XXIX Encontro Nacional da APL (pp. 121-137). Coimbra: Universidade de Coimbra.
Moniz, H., Batista, F., Trancoso, I., & Mata, A. I. (2014). Discriminação automática de sinais de pontuação e de disfluências. In Textos Selecionados do XXIX Encontro Nacional da APL (pp. 395-405). Coimbra: Universidade de Coimbra.
Moniz, H., Batista, F., Trancoso, I., & Mata, A. I. (2012). Análise de interrogativas em diferentes domínios. In Textos Selecionados do XXVII Encontro Nacional da APL (pp. 496-510). Lisboa: APL.
Moniz, H., Mata, A. I., & Trancoso, I. (2011). A classificação das disfluências como mecanismos de (dis) fluência e os seus contextos prosódicos. In Textos Seleccionados do XXVI Encontro Nacional da APL (pp. 420-432). Porto: APL.
Moniz, H., Mata, A. I., & Viana, M. C. (2008). Mecanismos de (dis) fluência em contexto escolar. In Textos Seleccionados do XXIII Encontro Nacional da Associação Portuguesa de Linguística (pp. 329-343). .
Viana, M. C., & Mata, A. I. (2001). Fraseamento prosódico automático em PE com técnicas CART, in Razões e Emoção - Miscelânea de Estudos Oferecida a Maria Helena Mira Mateus pela sua Jubilação. In . Castro & I. Duarte. Lisbon: DLGR-FLUL.
Matos, G. (2014). Anteposição de constituintes verbais, cópias e elipse. In O Universal e o particular: uma vida a comparar – Homenagem a Maria Francisca Xavier (Fiéis, A.; Lobo, M.; Madeira, A, pp. 231-251). Lisboa: Edições Colibri.
Gonçalves, A., & Matos, G. (2008). Restruturação e Anáfora do Complemento Nulo em Português Europeuin Textos Seleccionados do XXI Encontro Nacional da Associação Portuguesa de Linguística. In Textos Seleccionados do XXI Encontro Nacional da Associação Portuguesa de Linguística (Frota, S.; Santos, A.L., pp. 207-223). S. Retrieved from https://apl.pt/wp-content/uploads/2017/09/16-Goncalves_Matos.pdf
Matos, G. (1997). Configurações Sintácticas em Estruturas de Colocação Simultânea de Clítico. In Sentido que a Vida Faz — Homenagem a Óscar Lopes (A. M. Brito and F. Oliveira and I. P. de Lima and R. M. Martelo. Porto: Campo das Letras, pp. 705-717). Porto: Campo das Letras.
Matos, G. (1991). Frases Coordenadas, Sujeito Nulo e Co-referência. In Encontro de Homenagem a Óscar Lopes (pp. 23-140). Maia: Gráfica Miradouro.
Matos, G. (1989). Null VP in Portuguese and English, in Cadernos da Associação Portuguesa de Linguistica -‘Workshop’ sobre Gramática Generativa. In . Lisboa: Reprografia da Associação de Estudantes da Faculdade de Letras de Lisboa.
Marrafa, P., Amaro, R., Freire, N., & Mendes, S. (2012). Portuguese Controlled Language: coping with ambiguity. In T. Kuhn & Fuchs, N. E. (Eds.), Controlled Natural Languages – CNL 2012 (pp. 152-166). Berlin Heidelberg: Springer-Verlag.
Amaro, R., Mendes, S., & Marrafa, P. (2010). Encoding Event and Argument Structures in Wordnets. In P. Sojka, Horák, A., Kopecek, I., & Pala, K. (Eds.), TSD 2010 (pp. 21-28). Berlin Heidelberg: Springer-Verlag.
Amaro, R., Mendes, S., & Marrafa, P. (2010). Lexical-conceptual relations as qualia role encoders. In P. Sojka, Horák, A., Kopecek, I., & Pala, K. (Eds.), TSD 2010 (pp. 29-36). Berlin Heidelberg: Springer-Verlag.
Martins, F., Rodrigues, C., & Brissos, F. (2014). Fronteiras de vozeamento na identificação do falante. In Textos selecionados do XXIX Encontro da APL (pp. 345-359). Porto: APL.
Rodrigues, C. (2012). Variantes não-standard e tipo de discurso: (des) encontro de resultados. In Nada na linguagem lhe é estranho. Estudos em homenagem a Isabel Faria (pp. 215-228). A. Costa & I. Duarte. Porto: Edições Afrontamento.
Rodrigues, C. (2012). Aspetos segmentais e variação dialetal. In Os sons que estão dentro das palavras (pp. 143-170). in, M. J. Freitas, C. Rodrigues, T. Costa & A. Castelo. Lisboa: Colibri.
Mateus, M. H., & Rodrigues, C. (2003). A vibrante em coda no Português Europeu . In Teoria Linguística Fonologia e outros Temas (D. Hora and G. Collischonn. João Pessoa, pp. 181-199). Universitária da universidade Federal da Paraíba.
Móia, T., & Alves, A. T. (2013). Tempo Adjunto e Tempo Discursivo. In Gramática do Português (Volume I) (E. B. P. Raposo et al., orgs. , pp. 557-581). Lisboa: Fundação Calouste Gulbenkian.
Móia, T. (2013). Orações Relativas de Quantidade e Quantificadores Implícitos. In XXVIII Encontro Nacional da Associação Portuguesa de Linguística. Textos Selecionados 2012. Faro 2012 (pp. 473-492). Coimbra: Associação Portuguesa de Linguística.
pdf237.85 KB
Móia, T. (2012). On Temporal Measure Quantification over Eventualities. In La Quantification et Ses Domaines, Actes du Colloque de Strasbourg, 19-21 Octobre 2006 (C. Schnedecker & C. Armbrecht, éds., pp. 367-380). Paris: Honoré Champion.
pdf210.48 KB