Grammar & Resources

The group is centered on modeling linguistic knowledge, integrating interfaces between different areas of grammar and knowledge about how language is put to use. Joint work in formal phonology, lexicon, syntax and semantics allows building an integrated model of grammar, considering how it is represented in the human mind, as well as how it can be computationally modelled; work on L1 and L2 acquisition is at the core of this work. The integration of models of language representation and models of language use is achieved through the study of corpora.

The production of corpora and resources is justified by the goal of developing documentation and providing descriptions of contemporary European Portuguese, but also of understudied contact languages or varieties (Portuguese-based creoles, national varieties of Portuguese in Africa and Asia). The group also produces resources for the study of L1 and L2 acquisition in different settings. The group integrates CLARIN LP.

Research on L1 and L2 acquisition contributes to CLUL’s general purpose of effectively articulating fundamental and applied research, namely in the areas of Educational Linguistics and Clinical Linguistics.

General goals:

- To produce new resources for the study of Portuguese and Portuguese-based creoles;

- To pursue basic research on natural language modeling, integrating knowledge on interfaces between language modules;

- To continue the documentation and description of understudied creoles and new varieties of Portuguese that emerged in a context of language contact;

- To develop the study of language acquisition with an emphasis on language contact situations (see new international Heritage Language Consortium) and on the comparison between typical and atypical development;

- To explore the potential of comparative linguistics in the production of resources for translation and to promote connections with the industry in the area of translation.

 

Resources Type
A Lexicon of Child European Portuguese - CEPLEXicon Lexicon
A Portuguese Native Language Identification Dataset - NLI-PT Database
Acquisition of European Portuguese Databank - AcEP Database
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Database
Consonantic Sequences Oral and Written Production Tasks - PORESC Tool
Controlled Portuguese - CLG Database
Corpora of PLE Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus of Cape Verdean Portuguese Corpus
Corpus of Sri Lanka Portuguese Corpus
Corpus of the Diaries of the Portuguese Parliament annotated with PoS - PTPARL Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - European Portuguese Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Tool
Dados Orais de Cabo Verde - CV Words Database
Demo de Subespecificação e Desambiguação de Escopo Tool
Dictionary of Hindi-Portuguese-Hindi Database
Diu Indo-Portuguese Data Set Database
Learner Corpus of Portuguese L2 - COPLE2 Corpus
LT Corpus (Literary Corpus) - LT Corpus Corpus
Modality Lexicon - MODAL-LEX-PT Lexicon
Multifunctional Computational Lexicon of Contemporary Portuguese Lexicon
Named Entity Recognizer - CRPC-NER Tool
Nominal Multiword Lexical Units in European Portuguese Lexicon
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Corpus of Writing and Speech of Children in the Early Years of Schooling - EFFE-On Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Database
Pereira&Freitas - EP Corpus
Person-Machine Interaction in Natural Language - INQUER Database
PhonoDis Corpus
Phonological Awareness Tasks for First Grade School Children - TCFC Tool
Portuguese Biographies - Bio-PT Database
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Lexicon
Portuguese Technical Lexica - LEXTEC Lexicon
Portuguese Discourse Bank - CRPC-DB Corpus
Quotations database - CRPC-quotations Database
Ramalho – EP Corpus
Reference Corpus of Contemporary Portuguese - CRPC Corpus
Santome Structure Dataset Database
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Spoken Portuguese - Geographical and Social Varieties Corpus
Vocatives in European Portuguese Corpus
Word Combination in European Portuguese - LEX-MWE-PT Lexicon
WordNet.PT Lexicon
Journal Paper
Delgado, J. P., Raposo, A. L., & Santos, A. L. (2021). Assessing intervention effects in sentence processing: object relatives vs. subject control. Frontiers In Psychology, 12. http://doi.org/doi: 10.3389/fpsyg.2021.610909
Cadime, I., Santos, A. L., Ribeiro, I., & Viana, F. L. (2021). Parental reports of preschoolers’ lexical and syntactic development: validation of the CDI-III for European Portuguese. Frontiers In Psychology, 12:677575. http://doi.org/doi: 10.3389/fpsyg.2021.677575
Catarino, I., Almeida, L., Santos, C. dos, & Freitas, M. J. (2021). Sobre o impacto da constituência silábica na repetição de pseudopalavras: dados preliminares do desenvolvimento típico para a validação do LITMUS-QU-NWR-EP. Revista Da Associação Portuguesa De Linguística, (8), 87-104. http://doi.org/10.26334/2183-9077/rapln8ano2021a7
Móia, T. (2021). Alguns adjuntos temporais com especial relevância para a tradução inglês-português: o caso de 'since' - 'desde' e expressões afins. Revista Da Associação Portuguesa De Linguística, 8, 168-185. http://doi.org/10.26334/2183-9077/rapln8ano2021a12
pdf838.02 KB
Costa, T., Rodrigues, C., & Freitas, M. J. (2021). Consoantes (não) soantes em final de palavra: dados da escrita de crianças portuguesas . Linguagem & Ensino, 24, Nº 4, Programa de Pós-Graduação em Letras da Universidade Federal de Pelotas, Brasil, 843-867. http://doi.org/10.15210/RLE.V24I4
Branco, A., Mendes, A., & Quaresma, P. (2021). Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem PORTULAN CLARIN. Revista Da Associação Portuguesa De Linguística, 8, 54-70. http://doi.org/https://doi.org/10.26334/2183-9077/rapln8ano2021a5
Móia, T. (2022). Norma e variação em orações relativas complexas do português europeu. Phin. Philologie Im Netz, Beiheft 28 (David Paul Gerards, Albert Wall & Benjamin Meisnitzer, eds./Hg., Micro-Variation meets Complex Systems Theory – seven case studies on Portuguese), 159-181.
pdf336.25 KB
Gonçalves, A., & Colaço, M. (2019). A coesão referencial em textos traduzidos do inglês para o português: a questão dos sujeitos nulos. Revista Da Associação Portuguesa De Linguística, 5, 21.
Gonçalves, R., Duarte, I., & Hagemeijer, T. (2022). Dative Microvariation in African Varieties of Portuguese. Journal Of Portuguese Linguistics. http://doi.org/10.16995/jpl.8488
Hagemeijer, T., Leal, A., Madureira, R., & Cordeiro , J. (2022). Goal arguments of ir ‘to go’ and chegar ‘to arrive’ in three African varieties of Portuguese. Journal Of Portuguese Linguistics, 4(1). http://doi.org/10.16995/jpl.8634
Almeida, J., Fehn, A. -M., Ferreira, M., Machado, T., Hagemeijer, T., Rocha, J., & Gayà-Vidal, M. (2021). The genes of freedom: Genome-wide insignts into marronage, admixture and ethnogenesis in the Gulf of Guinea. Genes, 12(833).
Martins, C., Silva, F., & Pinto, J. (2022). O que ainda não sabemos e precisávamos de saber para o ensino de Português Língua Não Materna. Revista Da Associação Portuguesa De Linguística, 9-10, 301-313. http://doi.org/https://doi.org/10.26334/2183-9077/rapln9ano2022mr5
Lobo, M., & Santos, A. L. (2022). Aquisição da sintaxe do português como língua materna: ponto da situação. Revista Da Associação Portuguesa De Linguística, 9, 264-279.
Flores, C., & Almeida, L. (2022). Investigação em Bilinguismo. Caminhos percorridos e perspetivas futuras. Revista Da Associação Portuguesa De Linguística, 9, 250-263. http://doi.org/10.26334/2183-9077/rapln9ano2022mr2 (Original work published 2022-10-25)
Móia, T. (2022). Particularidades semânticas das expressões temporais com 'até' e desafios de tradução entre português e inglês. Linguística: Revista De Estudos Linguísticos Da Universidade Do Porto, 17, 117-149. http://doi.org/https://doi.org//10.21747/16466195/ling17a5
pdf414.6 KB
Zeyrek, D., Mendes, A., Oles̆kevic̆ienė, G., & Özer, S. (2022). An Exploratory Analysis of TED Talks in English and Lithuanian, Portuguese and Turkish Translations. Contrastive Pragmatics, 3(3), 452-479. http://doi.org/10.1163/26660393-bja10052
Mendes, A., Zeyrek, D., & Oles̆kevic̆ienė, G. (2023). Explicitness and implicitness of discourse relations in a multilingual discourse bank. Functions Of Language. http://doi.org/10.1075/fol.22011.men
Özer, S., Kurfalı, M., Zeyrek, D., Mendes, A., & Oles̆kevic̆ienė, G. (2022). Linking Discourse-level information and induction of bilingual discourse connective lexicons. Semantic Web, 13(6), 1081-1102. Retrieved from http://www.semantic-web-journal.net/system/files/swj3011.pdf
Móia, T. (2023). Sobre o uso de orações gerundivas adnominais em português. Estudos De Lingüística Galega, Vol 15 No 1. http://doi.org/https://doi.org/10.15304/elg.15.8668
pdf433.29 KB
Colaço, M., & Gonçalves, A. (2020). Sobre interferência sintática em tradução e em escrita autêntica. Revista Da Associação Portuguesa De Linguística, 7, 19.
Móia, T. (2023). Relativized temporal phrases: Language variation and change in contemporary Portuguese. Journal Of Portuguese Linguistics, 6, 1-49. http://doi.org/https://doi.org/10.16995/jpl.8923
pdf1.08 MB
Santos, A. L. (2023). On the resilience of obligatory control in inflected infinitives under object control verbs. Glossa: A Journal Of General Linguistics, 8(1), 36. http://doi.org/https://doi.org/10.16995/glossa.8857
Truppi, C. (2021). Predicational encoding in Upper Guinea linguistic area. Revista Do Gel, 18(3), 191-218. http://doi.org/10.21165/gel.v18i3.3167
Truppi, C. (2021). The copula cycle in Kriol. Journal Of Historical Syntax 5, (12), 1-27.
Gonçalves, A. (2022). Núcleos funcionais e variação linguística: o caso da Reestruturação. Revista De Estudos Linguísticos Da Universidade Do Porto, 1 (Special), 24. Retrieved from https://ojs.letras.up.pt/index.php/EL/article/view/12796/11653
Rodrigues, C., & Lourenço-Gomes, M. C. (2021). Dados de escrita de crianças de escolas portuguesas: vogais não acentuadas. Revista De Linguagem E Ensino, 24, Nº 4, Programa de Pós-graduação em Letras da Universidade Federal de Pelotas, Brasil, 775-798. http://doi.org/https://doi.org/10.15210/rle.v24i4.21270
Rodrigues, C., & Gomes, J. (2022). O quaijo que xerava bem: um estudo de produções escritas e orais do ditongo de crianças de dois dialetos portugueses. Revista De Estudos Linguísticos Da Universidade Do Porto, Vol. 1(N.º Especial de Homenagem à Professora Fátima Oliveira, CLUP), 313-339. http://doi.org/https://doi.org//10.21747/16466195/ling2022v1a13
Gomes, J., & Rodrigues, C. (2021). A escrita de /s/ e /z/ em português: dados de crianças do segundo ano de escolaridade. Revista Linguagem & Ensino, 24, Nº 4, Programa de Pós-Graduação em Letras da Universidade Federal de Pelotas, Brasil, 799-824. http://doi.org/HTTPS://DOI.ORG/10.15210/RLE.V24I4.21282
Duarte, I., Gonçalves, R., & Chimbutane, F. (2023). Dative possessor in Romance: a formal feature account with special reference to Portuguese. Journal Of Portuguese Linguistics, (4), 1-33. http://doi.org/https://doi.org/10.16995/jpl.9873