Grammar & Resources

The group is centered on modeling linguistic knowledge, integrating interfaces between different areas of grammar and knowledge about how language is put to use. Joint work in formal phonology, lexicon, syntax and semantics allows building an integrated model of grammar, considering how it is represented in the human mind, as well as how it can be computationally modelled; work on L1 and L2 acquisition is at the core of this work. The integration of models of language representation and models of language use is achieved through the study of corpora.

The production of corpora and resources is justified by the goal of developing documentation and providing descriptions of contemporary European Portuguese, but also of understudied contact languages or varieties (Portuguese-based creoles, national varieties of Portuguese in Africa and Asia). The group also produces resources for the study of L1 and L2 acquisition in different settings. The group integrates CLARIN LP.

Research on L1 and L2 acquisition contributes to CLUL’s general purpose of effectively articulating fundamental and applied research, namely in the areas of Educational Linguistics and Clinical Linguistics.

General goals:

- To produce new resources for the study of Portuguese and Portuguese-based creoles;

- To pursue basic research on natural language modeling, integrating knowledge on interfaces between language modules;

- To continue the documentation and description of understudied creoles and new varieties of Portuguese that emerged in a context of language contact;

- To develop the study of language acquisition with an emphasis on language contact situations (see new international Heritage Language Consortium) and on the comparison between typical and atypical development;

- To explore the potential of comparative linguistics in the production of resources for translation and to promote connections with the industry in the area of translation.

 

Resources Type
A Lexicon of Child European Portuguese - CEPLEXicon Lexicon
A Portuguese Native Language Identification Dataset - NLI-PT Database
Acquisition of European Portuguese Databank - AcEP Database
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Database
Consonantic Sequences Oral and Written Production Tasks - PORESC Tool
Controlled Portuguese - CLG Database
Corpora of PLE Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus of Cape Verdean Portuguese Corpus
Corpus of Sri Lanka Portuguese Corpus
Corpus of the Diaries of the Portuguese Parliament annotated with PoS - PTPARL Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - European Portuguese Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Tool
Dados Orais de Cabo Verde - CV Words Database
Demo de Subespecificação e Desambiguação de Escopo Tool
Dictionary of Hindi-Portuguese-Hindi Database
Diu Indo-Portuguese Data Set Database
Learner Corpus of Portuguese L2 - COPLE2 Corpus
LT Corpus (Literary Corpus) - LT Corpus Corpus
Modality Lexicon - MODAL-LEX-PT Lexicon
Multifunctional Computational Lexicon of Contemporary Portuguese Lexicon
Named Entity Recognizer - CRPC-NER Tool
Nominal Multiword Lexical Units in European Portuguese Lexicon
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Corpus of Writing and Speech of Children in the Early Years of Schooling - EFFE-On Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Database
Pereira&Freitas - EP Corpus
Person-Machine Interaction in Natural Language - INQUER Database
PhonoDis Corpus
Phonological Awareness Tasks for First Grade School Children - TCFC Tool
Portuguese Biographies - Bio-PT Database
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Lexicon
Portuguese Technical Lexica - LEXTEC Lexicon
Portuguese Discourse Bank - CRPC-DB Corpus
Quotations database - CRPC-quotations Database
Ramalho – EP Corpus
Reference Corpus of Contemporary Portuguese - CRPC Corpus
Santome Structure Dataset Database
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Spoken Portuguese - Geographical and Social Varieties Corpus
Vocatives in European Portuguese Corpus
Word Combination in European Portuguese - LEX-MWE-PT Lexicon
WordNet.PT Lexicon
Capítulo de Livro
Rodrigues, C. (2016). Main current processes of phonological variation. In The Handbook of Portuguese Linguistics (Costa, J, S. Menuzzi e L. Wetzels, Vol. 28, pp. 504-525). WileyBlackwell.
Santos, A. L. (2017). Alguns aspetos da aquisição de orações subordinadas completivas. In A aquisição de língua materna e não materna (M. J. and A. L. Santos). Berlim: Language Science Press. Retrieved from http://langsci-press.org/
Santos, A. L., & Lopes, R. (2017). Primeiros passos na aquisição da sintaxe: direccionalidade movimento do verbo e flexão. In A aquisição de língua materna e não materna (M. J. and A. L. Santos). Berlim: Language Science Press. Retrieved from http://langsci-press.org/
Vanderschueren, C., & Mendes, A. (2015). Panorama de los corpus y textos del portugués europeo. In M. Iliescu & Roegiest, E. (Eds.), Manuel des Anthologies, Corpus et Textes Romans (pp. 58-80). Berlin: Walter de Gruyter.
Bacelar do Nascimento, M. F., Mendes, A., Antunes, S., & Pereira, L. (2014). The Reference Corpus of Contemporary Portuguese and related resources. In B. Sardinha & Ferreira, T. (Eds.), Working with Portuguese Corpora. Bloomsbury Publishing.
Oliveira, F., & Mendes, A. (2013). Modalidade. In Gramática do Português, vol. I (E.B.P. Raposo, Maria Bacelar do Nascimento, Maria Mota, Luísa Segura, Amália Mendes (eds.), Vol. I, pp. 623-669). Lisboa: Fundação Calouste Gulbenkian.
Mendes, A. (2013). Processos de gramaticalização. In Gramática do Português (Amália Mendes, Luísa Segura, Maria Mota, Maria Bacelar do Nascimento, E. Raposo (eds.), Vol. I, pp. 249-293). Lisboa: Fundação Calouste Gulbenkian.
Mendes, A. (2013). Organização textual e articulação de orações. In Gramática do Português (Amália Mendes, Luísa Segura, Maria Mota, Maria Bacelar do Nascimento, E. Raposo (eds.), Vol. II, pp. 1691-1755). Lisboa: Fundação Calouste Gulbenkian.
Mendes, A., & Bacelar do Nascimento, M. F. (2007). Grammaticalization Processes In a Spoken Portuguese Corpus: space, time and discourse. In M. C. C. C. et al. (Ed.), Spoken Corpora In Applied Linguistics (pp. 147-160). Bern: Peter Lang.
Bacelar do Nascimento, M. F., Mendes, A., & Antunes, S. (2006). Typologies of MultiWord Expressions Revisited: A Corpus-driven Approach. In K. et al. (Ed.), Spoken Language Corpus and Linguistic Informatics (Vol. V, pp. 227-244). Jonh Benjamins.
Mendes, A., Amaro, R., & Bacelar do Nascimento, M. F. (2004). Morphological Tagging of a Spoken Portuguese Corpus Using Available Resources. In A. Branco, Mendes, A., & Ribeiro, R. (Eds.), Language Technology for Portuguese: Shallow processing tools and resources (pp. 47-62). Lisboa: Colibri.
Mendes, A. (2003). A expressão da emoção em predicados verbais do português: uma análise sintáctico-semântica com base num corpus. In S. F. Brandão & Mota, M. A. (Eds.), Análise contrastiva de variedades do português: primeiros estudos (pp. 103-123). Rio de Janeiro: In Fólio.
Bacelar do Nascimento, M. F., Callou, D., Serra, C., Barbosa, A., Barreto, F., Amaro, R., et al. (2003). A posição do adjectivo no sintagma nominal. In S. F. Brandão & Mota, M. A. (Eds.), Análise contrastiva de variedades do português: primeiros estudos (pp. 1-35). Rio de Janeiro: In Fólio.
Mendes, A. (2000). Os papéis semânticos Experienciador e Causador nos sintagmas nominais com adjectivos psicológicos. In E. Gärtner, Hundt, C., & Schönberger, A. (Eds.), Estudos de Gramática portuguesa (Vol. III, pp. 171-186). Frankfurt am Main: TFM.
Marrafa, P., Gonçalves, J. B., & Mendes, A. (1999). A Sintaxe do LE PAROLE. In P. Marrafa & Mota, M. A. (Eds.), Linguística Computacional. Investigação Fundamental e Aplicações (pp. 191-205). Lisboa: Associação Portuguesa de Linguística.
Alexandre, N., & Hagemeijer, T. (2013). Estratégias de relativização de PPs no mundo luso-atlântico: crioulos de base lexical portuguesa e variedades do português. In Para a História do Português Brasileiro – Volume III: Sintaxe Comparativa entre o Português Brasileiro e Língua Crioulas de Base Lexical Portuguesa (D. Moura & M. Sibaldo, Vol. III:, pp. 49-71). Maceió: EDUFAL.
Alexandre, N., & Hagemeijer, T. (2007). Bare Nouns and the Nominal Domain In Santome. In Noun Phrases In Creole Languages: a multi-faceted approach (M. Baptista & J. Guéron, pp. 37-60). Amsterdam: John Benjamins Publ.
Alexandre, N. (2000). A Estratégia Resumptiva nas Relativas do Português Europeu, do crioulo da Guiné-Bissau e do São Tomense: uma análise comparativa. In Anais (pp. 103-120). Lisboa: Ed Autónoma.
Alexandre, N., & Lang, J. (2016). Die Korrespondenz zwischen António J Ribeiro und Hugo Schuchardt [A correspondência entre António Joaquim Ribeiro e Hugo Schuchardt]. In Hugo Schuchardt Archiv (Bernhard Hurch). . Retrieved from http://schuchardt.unigraz.at/korrespondenz/briefe/korrespondenzpartner/alle/1014/briefe/jahr/alle
Rego, R., Won, M., Martins, B., Mendes, A., del Río, I., & Lejeune, P. (2018). The crisis impact on the political discourse of Portuguese social partners. In M. Lobo, da Silva, F. C., & Zúquete, J. P. (Eds.), Changing Societies: Legacies and Challenges (Vol. Vol. ii. Citizenship in Crisis, pp. 161-184). Lisboa: Imprensa de Ciências Sociais. Retrieved from https://doi.org/10.31447/ics9789726715047.07
Mendes, A., & del Río, I. (2018). Using a Discourse Bank and a Lexicon for the Automatic Identification of Discourse Connectives. In Computational Processing of the Portuguese Language, PROPOR 2018 (pp. 211-221). Springer International Publishing.
Móia, T. (1992). Proposta de Revisão da 'Elevação de Objecto' no Quadro da Teoria da Regência e da Ligação. In Actas do VII Encontro da Associação Portuguesa de Linguística (Lisboa 1991) (pp. 257-270). Lisboa: Associação Portuguesa de Linguística.
pdf51.52 KB
Móia, T. (1995). Aspectos da Semântica das Expressões Temporais com 'desde' e 'até' - Questões de 'Aktionsart'. In Actas do X Encontro Nacional da Associação Portuguesa de Linguística (Évora 1994) (pp. 341-358). Lisboa: Associação Portuguesa de Linguística.
pdf170.33 KB
Móia, T. (1997). Sintagmas com 'durante' e 'em' como Expressões de Localização Temporal ou de Duração. In Actas do XII Encontro Nacional da Associação Portuguesa de Linguística (Braga-Guimarães, 30 de Setembro a 2 de Outubro de 1996), Vol. I (pp. 227-240). Lisboa: Associação Portuguesa de Linguística.
pdf140.19 KB
Móia, T. (1998). On the Expression of Duration and Temporal Location through Adverbials Containing Predicates of Amounts of Time. In Proceedings of the XVIth International Congress of Linguists (Paris, 20-25 July 1997), CD-ROM (B. Caron, ed.). Oxford: Pergamon / Elsevier Science.
Móia, T. (1999). Semântica das Expressões Temporais com 'Haver'. In Actas do XIV Encontro Nacional da Associação Portuguesa de Linguística (Aveiro, 28-30 de Setembro de 1998), Vol. II (pp. 219-238). Braga: Associação Portuguesa de Linguística.
pdf194.76 KB
Móia, T., & Alves, A. T. (2001). Sobre a Expressão de Distâncias Temporais no Português Europeu e do Português Brasileiro. In Actas do XVI Encontro Nacional da Associação Portuguesa de Linguística (Coimbra, 28-30 de Setembro de 2000) (pp. 699-713). Lisboa: Associação Portuguesa de Linguística.
pdf63.14 KB
Móia, T. (2001). Temporal Location of Events and the Distribution of the Romance Counterparts of 'Since'-Adverbials. In Romance Syntax, Semantics and L2 Acquisition, Selected papers from the 30th Linguistic Symposium on Romance Languages, Gainesville, Florida, February 2000 (J. Camps & C. Wiltshire, eds., pp. 137-152). Amsterdam: John Benjamins.
Móia, T. (2001). Aspectos Sintáctico-Semânticos das Orações Relativas com 'quando' e 'como'. In Actas do XVI Encontro Nacional da Associação Portuguesa de Linguística (Coimbra, 28-30 de Setembro de 2000) (pp. 349-361). Lisboa: Associação Portuguesa de Linguística.
pdf56.47 KB
Móia, T. (2001). Sobre a Expressão da Duração em Português Europeu e Português Brasileiro: o Uso de Sintagmas com a Preposição 'por'. In Boletim da Associação Brasileira de Lingüística, Número Especial, II Congresso Internacional da ABRALIN, Fortaleza, Março de 2001, Anais - Vol. I (M. E. Soares, org., pp. 415-419). Fortaleza: ABRALIN.
pdf61.57 KB