Gramática & Recursos

Este grupo centra-se na modelação do conhecimento linguístico integrando conhecimento sobre interfaces entre diferentes áreas da gramática e conhecimento sobre o uso da língua. O grupo tem como característica distintiva o trabalho conjunto nas áreas da fonologia, do léxico, da sintaxe e da semântica, com o objetivo de construir um modelo integrado de gramática, considerando a forma como o conhecimento linguístico é representado na mente humana, bem como a forma como esse conhecimento poderá ser modelado computacionalmente; o trabalho sobre a aquisição de L1 e L2 está naturalmente no centro deste programa de investigação. A integração de modelos de representação do conhecimento linguístico e de modelos de uso da língua é conseguida através do estudo de corpora.

A produção de corpora e recursos em geral serve ainda o objetivo do grupo de produzir documentação e descrições do português europeu contemporâneo, bem como de línguas menos estudadas que resultam de contacto linguístico (crioulos de base lexical portuguesa, variedades nacionais do português em África e na Ásia). O grupo produz ainda recursos para o estudo da aquisição do português como L1 e como L2 em diferentes situações de aquisição. O grupo integra o CLARIN LP.

A investigação desenvolvida por vários membros do grupo na área da aquisição de L1 e L2 contribui diretamente para o objetivo geral do CLUL de articulação entre investigação fundamental e aplicada, nomeadamente nas áreas da Linguística Educacional e da Linguística Clínica.

São, atualmente, grandes objetivos do grupo:

- Produzir novos recursos para o estudo do português e de crioulos de base lexical portuguesa;

- Continuar investigação fundamental que visa a modelação do conhecimento linguístico, integrando conhecimento sobre interfaces internas à gramática;

- Continuar a documentação e descrição de crioulos e novas variedades do português que emergiram em situação de contacto de línguas;

- Desenvolver o estudo da aquisição do português, dando especial atenção a situações de contacto linguístico (no âmbito do recente Heritage Language Consortium) e à comparação entre desenvolvimento típico e atípico;

- Explorar a potencialidade da linguística comparada para a produção de recursos para a tradução e promover, na mesma área, ligações à indústria.

Recursos Tipo
A Lexicon of Child European Portuguese - CEPLEXicon Léxico
Acquisition of European Portuguese Databank - AcEP Base de dados
Banco do Discurso para o português - CRPC-DB Corpus
Base de dados de citações - CRPC-quotations Base de dados
Base de Dados para a Identificação do Português Língua Nativa - NLI-PT Base de dados
Biografias de personalidades portuguesas - Bio-PT Base de dados
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Base de dados
CoKri: a corpus of Guinea-Bissau Kriol / um corpus do Kriol da Guiné-Bissau - CoKri Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus de Português de Cabo Verde Corpus
Corpus de Português do Sri Lanka Corpus
Corpus de Referência do Português Contemporâneo - CRPC Corpus
Corpus de Textos Literários - LT Corpus Corpus
Corpus do Parlamento Português anotado com POS - PTPARL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus Online de Escrita e Fala de Crianças nos Primeiros Anos de Escolaridade - EFFE-On Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - Português Europeu Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Ferramenta
Dados Orais de Cabo Verde - CV Words Base de dados
Demo de Subespecificação e Desambiguação de Escopo Ferramenta
Dicionário de Hindi-Português-Hindi Base de dados
Discurso Informal de Lisboa e Braga - DILeB Corpus
Diu Indo-Portuguese Data Set Base de dados
Interacção Pessoa-Máquina em Linguagem Natural - INQUER Base de dados
Learner Corpus of Portuguese L2 - COPLE2 Corpus
Léxico de modalidade - MODAL-LEX-PT Léxico
Léxico Multifuncional Computorizado do Português Contemporâneo Léxico
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Base de dados
Pereira&Freitas - EP Corpus
PhonoDis Corpus
Português Controlado - CLG Base de dados
Português Falado - Variedades Geográficas e Sociais Corpus
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Léxico
Portuguese Technical Lexica - LEXTEC Léxico
Ramalho – EP Corpus
Recolha de dados de PLE Corpus
Reconhecedor de Entidades Nomeadas - CRPC-NER Ferramenta
Santome Structure Dataset Base de dados
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Tarefas de Consciência Fonológica para Crianças do 1.º Ciclo do Ensino Básico - TCFC Ferramenta
Tarefas de produção orais e escritas de sequências consonânticas - PORESC Ferramenta
Unidades Lexicais Multipalavra Nominais em Português Europeu Léxico
Vocativos em Português Europeu Corpus
Word Combination in European Portuguese - LEX-MWE-PT Léxico
WordNet.PT Léxico
Artigo em Atas
Costa, A., Alexandre, N., Santos, A. L., & Soares, N. (2008). Efeitos de modelização no input: o caso da aquisição de conectores. In Textos Seleccionados do XXIII ENAPL 2007 (S. Frota & A. L. Santos, pp. 131-142). Lisboa: Colibri.
Alexandre, N. (2007). Interrogativas-Q em Crioulo de Cabo Verde: Movimento explícito/implícito ou sem movimento?. In Textos Seleccionados do XXII ENAPL 2006 (M. Lobo & M. Coutinho, pp. 41-55). Lisboa: Colibri.
Alexandre, N. (2006). Processos de relativização e marcadores relativos em Crioulo de Cabo Verde. In Textos Seleccionados do XXI ENAPL 2005 (F. Oliveira & J. Barbosa, pp. 83-95). Lisboa: Colibri.
Alexandre, N., Soares, V., & Verdial Soares, N. (2005). O Domínio Nominal em CCV: o puzzle dos Bare Nouns. In XX Encontro Nacional da APL (pp. 337-350). Lisboa: Fundação Calouste Gulbenkian.
Alexandre, N., & Hagemeijer, T. (2004). The Nominal Domain in Santome. In Los Criollos de Base Ibérica: ACBLPE 2003 (M. Fernández & N. Vázquez, pp. 85-100). Madrid/Frankfurt: Iberoamericana e Vervuert.
Alexandre, N., & Hagemeijer, T. (2002). Pronomes resumptivos e abandono de preposição nos crioulos atlânticos de base lexical portuguesa. In XVII Encontro Nacional da APL (pp. 17-29). Lisboa: Colibri.
Alexandre, N. (2001). Proposta de representação dos DPs relativizados: a análise [NP CP NP]. In XVI Encontro Nacional da APL (pp. 35-46). Lisboa: Colibri.
Alexandre, N. (2000). Reflexões sobre a estrutura dos DPs relativizados: a análise [DP Dº CP] de Kayne 1994. In XV Encontro da APL (pp. 55-74). Braga: Gráfica de Coimbra.
Alexandre, N. (1999). Estratégias de Relativização em Português Europeu: o caso das relativas resumptivas. In XIV Encontro da APL, Braga: Gráfica de Coimbra (pp. 29-39).
del Río, I., & Mendes, A. (2018). Error annotation in a Learner Corpus of Portuguese. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published may)
Mendes, A., del Río, I., Stede, M., & Dombek, F. (2018). A Lexicon of Discourse Markers for Portuguese-LDM-PT. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published may)
Lejeune, P., & Mendes, A. (2018). Discourse relations with explicit and implicit arguments: The case of European Portuguese aliás. In Proceedings of the Cross-Linguistic Discourse Annotation: Applications and Perspectives, Final Action Conference TextLink. Toulouse.
Zeyrek, D., Mendes, A., & Kurfalı, M. (2018). Multilingual Extension of PDTB-Style Annotation: The Case of TED Multilingual Discourse Bank. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published May 7-12, 2018)
Sequeira, J., Gonçalves, T., Quaresma, P., Mendes, A., & Hendrickx, I. (2018). A Multi- versus a Single-classifier Approach for the Identification of Modality in the Portuguese Language. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published May 7-12, 2018)
Santos, A. L., Jesus, A., & Abalada, S. (2019). How do children interpret novel control verbs?. In Proceedings of the 43rd annual Boston University Conference on Language Development (Megan M. Brown & Brady Dailey, pp. 585-598). Somerville, MA: Cascadilla Press.
Abalada, S., Cardoso, A., & Cabarrão, V. (2010). Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais. In XXV Encontro Nacional da Associação Portuguesa de Linguística. Textos Seleccionados (Ana Maria Brito, Fátima Silva, João Veloso & Alexandra Fiéis, pp. 81-94). Porto: Edições Colibri/APL.
Abalada, S., Cardoso, A., & Cabarrão, V. (2011). O Vocativo em Português Europeu: Estudo de Parâmetros Prosódicos em Vocativos com Diferentes Distribuições. In XXVI Encontro Nacional da Associação Portuguesa de Linguística. Textos Seleccionados (Armanda Costa, Isabel Falé & Pilar Barbosa, pp. 1-16). Lisboa: Edições Colibri/APL.
Abalada, S. (2012). Aquisição das Periferias Esquerda e Direita em Português Europeu. In XXVII Encontro Nacional da Associação Portuguesa de Linguística. Textos Seleccionados (Armanda Costa, Cristina Flores & Nélia Alexandre, pp. 45-65). Lisboa: Edições Colibri/APL.
Abalada, S. (2013). Acquisition of the Left and Right Peripheries in European Portuguese. In Advances in Language Acquisition: Proceedings of GALA 2011 (Stavroula Stavrakaki, Polyxeni Konstatinopoulou & Marina Lalioti, pp. 4-13). Cambridge: Cambridge Scholars Publishing.
Santos, A. L., Généreux, M., Cardoso, A., Agostinho, C., & Abalada, S. (2014). A corpus of European Portuguese child and child-directed speech. In Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014) (pp. 1488-1491). Reykjavik: European Language Resources Association (ELRA).
Abalada, S., & Cardoso, A. (2015). Prosodic Effects of Syntactic Distribution in Vocatives in European Portuguese. In Parenthetical verbs (Stefan Schneider, Julie Glikman & Mathieu Avanzi, pp. 4-13). Berlin: De Gruyter.
Martins, A., Santos, A. L., & Duarte, I. (2018). Comprehension of relative clauses vs. control structures in SLI and ASD children. In Proceedings of the 42nd annual Boston University Conference on Language Development (Anne B. Bertolini and Maxwell J. Kaplan, pp. 493-506). Somerville, MA: Cascadilla Press.
Romeo, L., Mendes, S., & Bel, N. (2014). Using unmarked contexts in nominal lexical semantic classification. In 25th International Conference on Computational Linguistics - COLING 2014 (pp. 508-519). Dublin, Irlanda. (Original work published 2014)
Marrafa, P., Amaro, R., & Mendes, S. (2014). LexTec - a rich language resource for technical domains in Portuguese. In 9th International Conference on Language Resources and Evaluation - LREC 2014 (pp. 1044-1050). Reykjavik, Islândia. (Original work published 2014)
Necsulescu, S., Mendes, S., & Bel, N. (2014). Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instances. In 9th International Conference on Language Resources and Evaluation - LREC 2014 (pp. 4308-4315). Reykjavik, Islândia. (Original work published 2014)
Romeo, L., Mendes, S., & Bel, N. (2014). A cascade approach for complex-type classification. In 9th International Conference on Language Resources and Evaluation - LREC 2014 (pp. 4451-4458). (Original work published 2014)
Romeo, L., Mendes, S., & Bel, N. (2013). Towards the automatic classification of complex-type nominals. In 6th International Conference on Generative Approaches to the Lexicon – GL 2013 (pp. 21-28). Pisa, Itália.
Amaro, R., & Mendes, S. (2012). Towards merging common and technical lexicon wordnets. In 3rd Workshop on Cognitive Aspects of the Lexicon (CogALex-III) at the 24th International Conference on Computational Linguistics – COLING 2012 (pp. 147-160). Bombaim, Índia. (Original work published 2012)
Romeo, L., Mendes, S., & Bel, N. (2012). Using Qualia Information to Identify Lexical Semantic Classes in an Unsupervised Clustering Task. In 24th International Conference on Computational Linguistics – COLING 2012 (pp. 1029-1038). Bombaim, Índia. (Original work published 2012)
Mendes, S., Necsulescu, S., & Bel, N. (2012). Synonym extraction using a language graph model. In Workshop on Semantic Relations II – Enhancing Resources and Applications at the 8th international conference on Language Resources and Evaluation – LREC 2012 (pp. 1-9). Istambul, Turquia. (Original work published 2012)