Gramática & Recursos

Este grupo centra-se na modelação do conhecimento linguístico integrando conhecimento sobre interfaces entre diferentes áreas da gramática e conhecimento sobre o uso da língua. O grupo tem como característica distintiva o trabalho conjunto nas áreas da fonologia, do léxico, da sintaxe e da semântica, com o objetivo de construir um modelo integrado de gramática, considerando a forma como o conhecimento linguístico é representado na mente humana, bem como a forma como esse conhecimento poderá ser modelado computacionalmente; o trabalho sobre a aquisição de L1 e L2 está naturalmente no centro deste programa de investigação. A integração de modelos de representação do conhecimento linguístico e de modelos de uso da língua é conseguida através do estudo de corpora.

A produção de corpora e recursos em geral serve ainda o objetivo do grupo de produzir documentação e descrições do português europeu contemporâneo, bem como de línguas menos estudadas que resultam de contacto linguístico (crioulos de base lexical portuguesa, variedades nacionais do português em África e na Ásia). O grupo produz ainda recursos para o estudo da aquisição do português como L1 e como L2 em diferentes situações de aquisição. O grupo integra o CLARIN LP.

A investigação desenvolvida por vários membros do grupo na área da aquisição de L1 e L2 contribui diretamente para o objetivo geral do CLUL de articulação entre investigação fundamental e aplicada, nomeadamente nas áreas da Linguística Educacional e da Linguística Clínica.

São, atualmente, grandes objetivos do grupo:

- Produzir novos recursos para o estudo do português e de crioulos de base lexical portuguesa;

- Continuar investigação fundamental que visa a modelação do conhecimento linguístico, integrando conhecimento sobre interfaces internas à gramática;

- Continuar a documentação e descrição de crioulos e novas variedades do português que emergiram em situação de contacto de línguas;

- Desenvolver o estudo da aquisição do português, dando especial atenção a situações de contacto linguístico (no âmbito do recente Heritage Language Consortium) e à comparação entre desenvolvimento típico e atípico;

- Explorar a potencialidade da linguística comparada para a produção de recursos para a tradução e promover, na mesma área, ligações à indústria.

Recursos Tipo
A Lexicon of Child European Portuguese - CEPLEXicon Léxico
Acquisition of European Portuguese Databank - AcEP Base de dados
Banco do Discurso para o português - CRPC-DB Corpus
Base de dados de citações - CRPC-quotations Base de dados
Base de Dados para a Identificação do Português Língua Nativa - NLI-PT Base de dados
Biografias de personalidades portuguesas - Bio-PT Base de dados
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Base de dados
CoKri: a corpus of Guinea-Bissau Kriol / um corpus do Kriol da Guiné-Bissau - CoKri Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus de Português de Cabo Verde Corpus
Corpus de Português do Sri Lanka Corpus
Corpus de Referência do Português Contemporâneo - CRPC Corpus
Corpus de Textos Literários - LT Corpus Corpus
Corpus do Parlamento Português anotado com POS - PTPARL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus Online de Escrita e Fala de Crianças nos Primeiros Anos de Escolaridade - EFFE-On Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - Português Europeu Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Ferramenta
Dados Orais de Cabo Verde - CV Words Base de dados
Demo de Subespecificação e Desambiguação de Escopo Ferramenta
Dicionário de Hindi-Português-Hindi Base de dados
Discurso Informal de Lisboa e Braga - DILeB Corpus
Diu Indo-Portuguese Data Set Base de dados
Interacção Pessoa-Máquina em Linguagem Natural - INQUER Base de dados
Learner Corpus of Portuguese L2 - COPLE2 Corpus
Léxico de modalidade - MODAL-LEX-PT Léxico
Léxico Multifuncional Computorizado do Português Contemporâneo Léxico
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Base de dados
Pereira&Freitas - EP Corpus
PhonoDis Corpus
Português Controlado - CLG Base de dados
Português Falado - Variedades Geográficas e Sociais Corpus
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Léxico
Portuguese Technical Lexica - LEXTEC Léxico
Ramalho – EP Corpus
Recolha de dados de PLE Corpus
Reconhecedor de Entidades Nomeadas - CRPC-NER Ferramenta
Santome Structure Dataset Base de dados
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Tarefas de Consciência Fonológica para Crianças do 1.º Ciclo do Ensino Básico - TCFC Ferramenta
Tarefas de produção orais e escritas de sequências consonânticas - PORESC Ferramenta
Unidades Lexicais Multipalavra Nominais em Português Europeu Léxico
Vocativos em Português Europeu Corpus
Word Combination in European Portuguese - LEX-MWE-PT Léxico
WordNet.PT Léxico
Artigo em Atas
Antunes, S., Bacelar do Nascimento, M. F., Casteleiro, J. M., Mendes, A., Pereira, L., & Sá, T. (2006). Corpus-based extraction and identification of Portuguese Multiword Expressions. In Actes de la 13eme conférence Traitement Automatique des Langues Naturelles - TALN 2006, April 10-13 2006, Leuven.
Bacelar do Nascimento, M. F., Mendes, A., & Pereira, L. (2004). Providing on-line access to Portuguese language resources: corpora and lexicons. In Proceedings of the IV International Conference on Language Resources and Evaluation - LREC2004, May 26-28 2004, Lisbon, Centro de Cultural de Belém (pp. 1825-1828).
Mendes, A., Amaro, R., & Bacelar do Nascimento, M. F. (2003). Reusing resources for the morphosyntactic annotation of a spoken Portuguese corpus. In A. Branco, Mendes, A., & Ribeiro, R. (Eds.), Tagging and Shallow Processing of Portuguese: workshop notes of TASHA 2003. Lisboa: Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa.
Pereira, L. A. S., & Mendes, A. (2002). An Electronic Dictionary of Collocations for European Portuguese: Methodology, Results and Applications. In Proceedings of the 10th EURALEX International Congress, August 13-17 2002, Copenhagen, Denmark.
Mendes, A. (2002). Uma análise dos verbos psicológicos com base nos dados de um corpus: regularidade, variação e polissemia verbal. In I. M. Duarte, Barbosa, J., Matos, S., & Hüsgen, T. (Eds.), Encontro comemorativo dos 25 anos do Centro de Linguística da Universidade do Porto (Vol. 1, pp. 21-34).
Bacelar do Nascimento, M. F., Mendes, A., & Santos, D. (1993). O corpus e a classificação sintáctica dos verbos. In Actas do Actas do 1º Encontro de Processamento da Língua Portuguesa Escrita e Falada - EPLP 93, Lisboa, INESC, UNINOVA, CLUL (pp. 125-129).
Mendes, A. (1992). A importância de um corpus para a elaboração de um dicionário. In Textes de la Réunion de travail - Texts of the Final Workshop PROTON I-II, September 21-22 1992, Leuven.
Cardoso, A., & Alexandre, N. (2013). Relativas clivadas em variedades não padrão do português. In Textos Selecionados do XVIII ENAPL 2012 (F. Silva, I. Falé & I. Pereira, pp. 205-227). Porto: APL.
Alexandre, N., Gonçalves, R., & Hagemeijer, T. (2011). A formação de frases relativas em português oral de Cabo Verde e de São Tomé. In Textos Seleccionados do XXVI ENAPL 2010 (A. Costa, P. Barbosa & I. Falé, pp. 17-34). Lisboa: APL.
Alexandre, N., & Hagemeijer, T. (2011). Os crioulos da Alta Guiné e do Golfo da Guiné: uma comparação sintáctica. In 7º Congresso Ibérico de Estudos Africanos – CIEA7, painel sobre Línguas crioulas de base portuguesa na África. Lisboa. Retrieved from http://repositorio-iul.iscte.pt/handle/10071/2412"
Alexandre, N. (2010). Uma análise de CP não expandido para o sistema de complementadores do Crioulo de Cabo Verde. In Textos Seleccionados do XXV ENAPL 2009 (A. Costa, P. Barbosa & I. Falé, pp. 111-126). Lisboa: Colibri.
Costa, A., Alexandre, N., Santos, A. L., & Soares, N. (2008). Efeitos de modelização no input: o caso da aquisição de conectores. In Textos Seleccionados do XXIII ENAPL 2007 (S. Frota & A. L. Santos, pp. 131-142). Lisboa: Colibri.
Alexandre, N. (2007). Interrogativas-Q em Crioulo de Cabo Verde: Movimento explícito/implícito ou sem movimento?. In Textos Seleccionados do XXII ENAPL 2006 (M. Lobo & M. Coutinho, pp. 41-55). Lisboa: Colibri.
Alexandre, N. (2006). Processos de relativização e marcadores relativos em Crioulo de Cabo Verde. In Textos Seleccionados do XXI ENAPL 2005 (F. Oliveira & J. Barbosa, pp. 83-95). Lisboa: Colibri.
Alexandre, N., Soares, V., & Verdial Soares, N. (2005). O Domínio Nominal em CCV: o puzzle dos Bare Nouns. In XX Encontro Nacional da APL (pp. 337-350). Lisboa: Fundação Calouste Gulbenkian.
Alexandre, N., & Hagemeijer, T. (2004). The Nominal Domain in Santome. In Los Criollos de Base Ibérica: ACBLPE 2003 (M. Fernández & N. Vázquez, pp. 85-100). Madrid/Frankfurt: Iberoamericana e Vervuert.
Alexandre, N., & Hagemeijer, T. (2002). Pronomes resumptivos e abandono de preposição nos crioulos atlânticos de base lexical portuguesa. In XVII Encontro Nacional da APL (pp. 17-29). Lisboa: Colibri.
Alexandre, N. (2001). Proposta de representação dos DPs relativizados: a análise [NP CP NP]. In XVI Encontro Nacional da APL (pp. 35-46). Lisboa: Colibri.
Alexandre, N. (2000). Reflexões sobre a estrutura dos DPs relativizados: a análise [DP Dº CP] de Kayne 1994. In XV Encontro da APL (pp. 55-74). Braga: Gráfica de Coimbra.
Alexandre, N. (1999). Estratégias de Relativização em Português Europeu: o caso das relativas resumptivas. In XIV Encontro da APL, Braga: Gráfica de Coimbra (pp. 29-39).
del Río, I., & Mendes, A. (2018). Error annotation in a Learner Corpus of Portuguese. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published may)
Mendes, A., del Río, I., Stede, M., & Dombek, F. (2018). A Lexicon of Discourse Markers for Portuguese-LDM-PT. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published may)
Lejeune, P., & Mendes, A. (2018). Discourse relations with explicit and implicit arguments: The case of European Portuguese aliás. In Proceedings of the Cross-Linguistic Discourse Annotation: Applications and Perspectives, Final Action Conference TextLink. Toulouse.
Zeyrek, D., Mendes, A., & Kurfalı, M. (2018). Multilingual Extension of PDTB-Style Annotation: The Case of TED Multilingual Discourse Bank. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published May 7-12, 2018)
Sequeira, J., Gonçalves, T., Quaresma, P., Mendes, A., & Hendrickx, I. (2018). A Multi- versus a Single-classifier Approach for the Identification of Modality in the Portuguese Language. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published May 7-12, 2018)
Santos, A. L., Jesus, A., & Abalada, S. (2019). How do children interpret novel control verbs?. In Proceedings of the 43rd annual Boston University Conference on Language Development (Megan M. Brown & Brady Dailey, pp. 585-598). Somerville, MA: Cascadilla Press.
Abalada, S., Cardoso, A., & Cabarrão, V. (2010). Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais. In XXV Encontro Nacional da Associação Portuguesa de Linguística. Textos Seleccionados (Ana Maria Brito, Fátima Silva, João Veloso & Alexandra Fiéis, pp. 81-94). Porto: Edições Colibri/APL.
Abalada, S., Cardoso, A., & Cabarrão, V. (2011). O Vocativo em Português Europeu: Estudo de Parâmetros Prosódicos em Vocativos com Diferentes Distribuições. In XXVI Encontro Nacional da Associação Portuguesa de Linguística. Textos Seleccionados (Armanda Costa, Isabel Falé & Pilar Barbosa, pp. 1-16). Lisboa: Edições Colibri/APL.
Abalada, S. (2012). Aquisição das Periferias Esquerda e Direita em Português Europeu. In XXVII Encontro Nacional da Associação Portuguesa de Linguística. Textos Seleccionados (Armanda Costa, Cristina Flores & Nélia Alexandre, pp. 45-65). Lisboa: Edições Colibri/APL.
Abalada, S. (2013). Acquisition of the Left and Right Peripheries in European Portuguese. In Advances in Language Acquisition: Proceedings of GALA 2011 (Stavroula Stavrakaki, Polyxeni Konstatinopoulou & Marina Lalioti, pp. 4-13). Cambridge: Cambridge Scholars Publishing.