Gramática & Recursos

Este grupo centra-se na modelação do conhecimento linguístico integrando conhecimento sobre interfaces entre diferentes áreas da gramática e conhecimento sobre o uso da língua. O grupo tem como característica distintiva o trabalho conjunto nas áreas da fonologia, do léxico, da sintaxe e da semântica, com o objetivo de construir um modelo integrado de gramática, considerando a forma como o conhecimento linguístico é representado na mente humana, bem como a forma como esse conhecimento poderá ser modelado computacionalmente; o trabalho sobre a aquisição de L1 e L2 está naturalmente no centro deste programa de investigação. A integração de modelos de representação do conhecimento linguístico e de modelos de uso da língua é conseguida através do estudo de corpora.

A produção de corpora e recursos em geral serve ainda o objetivo do grupo de produzir documentação e descrições do português europeu contemporâneo, bem como de línguas menos estudadas que resultam de contacto linguístico (crioulos de base lexical portuguesa, variedades nacionais do português em África e na Ásia). O grupo produz ainda recursos para o estudo da aquisição do português como L1 e como L2 em diferentes situações de aquisição. O grupo integra o CLARIN LP.

A investigação desenvolvida por vários membros do grupo na área da aquisição de L1 e L2 contribui diretamente para o objetivo geral do CLUL de articulação entre investigação fundamental e aplicada, nomeadamente nas áreas da Linguística Educacional e da Linguística Clínica.

São, atualmente, grandes objetivos do grupo:

- Produzir novos recursos para o estudo do português e de crioulos de base lexical portuguesa;

- Continuar investigação fundamental que visa a modelação do conhecimento linguístico, integrando conhecimento sobre interfaces internas à gramática;

- Continuar a documentação e descrição de crioulos e novas variedades do português que emergiram em situação de contacto de línguas;

- Desenvolver o estudo da aquisição do português, dando especial atenção a situações de contacto linguístico (no âmbito do recente Heritage Language Consortium) e à comparação entre desenvolvimento típico e atípico;

- Explorar a potencialidade da linguística comparada para a produção de recursos para a tradução e promover, na mesma área, ligações à indústria.

Recursos Tipo
A Lexicon of Child European Portuguese - CEPLEXicon Léxico
Acquisition of European Portuguese Databank - AcEP Base de dados
Banco do Discurso para o português - CRPC-DB Corpus
Base de dados de citações - CRPC-quotations Base de dados
Base de Dados para a Identificação do Português Língua Nativa - NLI-PT Base de dados
Biografias de personalidades portuguesas - Bio-PT Base de dados
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Base de dados
CoKri: a corpus of Guinea-Bissau Kriol / um corpus do Kriol da Guiné-Bissau - CoKri Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus de Português de Cabo Verde Corpus
Corpus de Português do Sri Lanka Corpus
Corpus de Referência do Português Contemporâneo - CRPC Corpus
Corpus de Textos Literários - LT Corpus Corpus
Corpus do Parlamento Português anotado com POS - PTPARL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus Online de Escrita e Fala de Crianças nos Primeiros Anos de Escolaridade - EFFE-On Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - Português Europeu Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Ferramenta
Dados Orais de Cabo Verde - CV Words Base de dados
Demo de Subespecificação e Desambiguação de Escopo Ferramenta
Dicionário de Hindi-Português-Hindi Base de dados
Discurso Informal de Lisboa e Braga - DILeB Corpus
Diu Indo-Portuguese Data Set Base de dados
Interacção Pessoa-Máquina em Linguagem Natural - INQUER Base de dados
Learner Corpus of Portuguese L2 - COPLE2 Corpus
Léxico de modalidade - MODAL-LEX-PT Léxico
Léxico Multifuncional Computorizado do Português Contemporâneo Léxico
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Base de dados
Pereira&Freitas - EP Corpus
PhonoDis Corpus
Português Controlado - CLG Base de dados
Português Falado - Variedades Geográficas e Sociais Corpus
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Léxico
Portuguese Technical Lexica - LEXTEC Léxico
Ramalho – EP Corpus
Recolha de dados de PLE Corpus
Reconhecedor de Entidades Nomeadas - CRPC-NER Ferramenta
Santome Structure Dataset Base de dados
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Tarefas de Consciência Fonológica para Crianças do 1.º Ciclo do Ensino Básico - TCFC Ferramenta
Tarefas de produção orais e escritas de sequências consonânticas - PORESC Ferramenta
Unidades Lexicais Multipalavra Nominais em Português Europeu Léxico
Vocativos em Português Europeu Corpus
Word Combination in European Portuguese - LEX-MWE-PT Léxico
WordNet.PT Léxico
Artigo em Atas
Mendes, S., Necsulescu, S., & Bel, N. (2012). Synonym extraction using a language graph model. In Workshop on Semantic Relations II – Enhancing Resources and Applications at the 8th international conference on Language Resources and Evaluation – LREC 2012 (pp. 1-9). Istambul, Turquia. (Original work published 2012)
Marrafa, P., Amaro, R., & Mendes, S. (2011). WordNet.PTglobal – Extending WordNet.PT to Portuguese varieties. In DIALECTS’11 – the 1st workshop on Algorithms and Resources for Modelling of Dialects and Language Varieties at the 2011 Conference on Empirical Methods in Natural Language Processing – EMNLP 2011 (pp. 70-74). Edimburgo, Escócia. (Original work published 2011)
Mendes, S., & Amaro, R. (2009). Modeling adjectives in GL: accounting for all adjective classes. In 5th International Conference on Generative Approaches to the Lexicon (pp. 176-183). Pisa, Itália. (Original work published 2009)
Mendes, S. (2009). Modeling the impact of adjective position in the construction of NP meaning. In 5th International Conference on Generative Approaches to the Lexicon (pp. 201-208). Pisa, Itália. (Original work published 2009)
Marrafa, P., & Mendes, S. (2006). Modeling Adjectives in Computational Relational Lexica. In 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics – COLING/ACL 2006 (pp. 555-562). Sidney, Austrália. (Original work published 2006)
Mendes, S. (2006). Adjectives in WordNet.PT. In 3rd Global WordNet Association Conference (pp. 225-230). Ilha Jeju, República da Coreia. (Original work published 2006)
Marrafa, P., Amaro, R., Chaves, R. P., Lourosa, S., Martins, C., & Mendes, S. (2006). WordNet.PT new directions. In 3rd Global WordNet Association Conference (pp. 319-320). Ilha Jeju, República da Coreia. (Original work published 2006)
Mendes, S. (2005). Event modifying adjectives in Portuguese. In 3rd International Conference on Generative Approaches to the Lexicon (pp. 159-166). Genebra, Suíça. (Original work published 2005)
Mendes, S., & Moriceau, V. (2004). L’analyse des questions: intérêts pour la génération des réponses. In Workshop Question-Réponse à la Conférence TALN 2004 (Traitement Automatique du Langage Naturel) (pp. 413-422). Fez, Marrocos. (Original work published 2004)
Mendes, S., & Chaves, R. P. (2001). Enriching WordNet with Qualia Information. In Workshop on WordNet and Other Lexical Resources: Applications, Extensions and Customizations at the 2nd Meeting of the North American Chapter of the Association for Computational Linguistics – NAACL 2001 (pp. 108-112). Carnegie Mellon University, Pittsburgh, PA, EUA. (Original work published 2001)
Hagemeijer, T. (2019). Pontes entre os crioulos portugueses de África e a história do português: um caso de estudo de /b/ e /v/. In Ernestina Carrilho, Ana Maria Martins, Sandra Pereira e João Paulo Silvestre (orgs.), Estudos linguísticos e filológicos oferecidos a Ivo Castro, 766-779 (Lisboa: Centro de Linguística da Universidade de Lisboa).
Tiny, A., Amaro, H., Hendrickx, I., & Hagemeijer, T. (2012). O forro: A construção de um corpus. In Ana Cristina Roque, Gerhard Seibert e Vítor Rosado Marques (coord.). Livro de Atas - Colóquio Internacional: São Tomé e Príncipe numa perspectiva interdisciplinar, diacrónica e sincrónica. Lisboa: ISCTE-IUL; IICT, 597-609.
Hagemeijer, T., Hendrickx, I., Amaro, H., & Tiny, A. (2012). A Corpus of Santome. In Proceedings of the SALTMIL-AfLaT workshop, Istanbul, Turkey, 2012. European Language Resources Association (ELRA), 61-66.
Hagemeijer, T., & Santos, A. L. (2004). Elementos polares na periferia direita: negação aparentemente descontínua, afirmação enfática e tags. In Tiago Freitas & Amália Mendes (orgs.), Actas do XIX encontro nacional da Associação Portuguesa de Linguística, 465-476. Lisboa: APL.
Hagemeijer, T. (2000). Verbos e gramaticalização em são-tomense. In Ernesto d’Andrade, Maria Antónia Mota, Dulce Pereira (eds.), Actas do workshop sobre crioulos de base lexical portuguesa, 111-126. Lisboa: Colibri.
Andrade, A., & Rodrigues, C. (2005). Fusão de sibilantes: um processo de mudança/standardização?. In Actas do XX Encontro Nacional da Associação Portuguesa de Linguística (pp. 363-371). Lisboa.
Andrade, A., & Rodrigues, C. (2004). Um exemplo de sandhi consonântico variável em português. In Actas do XIX Encontro Nacional da Associação Portuguesa de Linguística (pp. 257-268). Lisboa.
Mateus, M. H., & Rodrigues, C. (2004). A vibrante em coda no português europeu. In Actas do XIX Encontro Nacional da Associação Portuguesa de Linguística (pp. 289-299). Lisboa.
Rodrigues, C. (2002). Questões de espraiamento em PE. In XVII Encontro Nacional da Associação Portuguesa de Linguística (pp. 419-432). Lisboa: APL.
Rodrigues, C. (2002). Variação linguística em Porto. In Actas do Encontro Comemorativo dos 25 anos do CLUP (pp. 119-130). Universidade do Porto.
Rodrigues, C. (2000). Novos dados acerca de /#øS$C/. In Actas do XV Encontro Nacional da Associação Portuguesa de Linguística (pp. 287-299). Faro: APL.
Rodrigues, C., & Martins, F. (2000). Espaço acústico das vogais acentuadas de Braga. In Actas do XV Encontro Nacional da Associação Portuguesa de Linguística (pp. 301-315). Faro: APL.
Andrade, E. d, & Rodrigues, C. (1999). Das escolas e das culturas: história de uma sequência consonântica. In Actas do XIV Encontro Nacional da Associação Portuguesa de Linguística (Volume II, pp. 117-133). Aveiro: APL.
Rodrigues, C., & Andrade, E. d. (1999). CPE VAR (Corpus de Português Europeu - Variação). In Poster in Actas do XIV Encontro Nacional da Associação Portuguesa de Linguística (Vol. II, pp. 627-629). Aveiro: APL.
Rodrigues, C. (1994). Nova proposta de datação de três manuscritos medievais. In Actas do IX Encontro Nacional da Associação Portuguesa de Linguística (pp. 363-376). Coimbra: APL - Colibri.
Branco, A., Mendes, A., Quaresma, P., Gomes, L., Silva, J., & Teixeira, A. (2020). Infrastructure for the Science and Technology of Language PORTULAN CLARIN. In LREC 2020 Worskhop IWLTP 2020 – 1st International Workshop on Language Technology Platforms (pp. 1-7). ELRA.
Freitas, M. J. (2004). The vowel [ɨ] in the acquisition of European Portuguese. In J. van Kampen & Baauw, S. (Eds.), GALA 2003 (pp. 163-174). Utrecht: LOT.
Matos, G. (2005). Parataxe como coordenação e justaposição – evidência a partir de um caso de elipse. In Actas do XX Encontro Nacional da Associação Portuguesa de Linguística (Duarte, I.; Leiria, I. , pp. 687-699). Lisboa: Associação Portuguesa de Linguistica. Retrieved from https://apl.pt/wp-content/uploads/2017/12/2004-55.pdf
Matos, G., & Prada, E. (2005). Construções contrastivas de focalização: adversativas vs. concessivas. In Actas do XX Encontro Nacional da Associação Portuguesa de Linguística (Duarte, I.; Leiria, I.). Retrieved from https://apl.pt/wp-content/uploads/2017/12/2004-56.pdf
Matos, G. (2004). Coordenação Frásica vs. Subordinação Adverbial. In Actas do XIX Encontro Nacional da Associação Portuguesa de Linguística (Freitas, T.; Mendes, A., pp. 555-567). Lisboa: Associação Portuguesa de Linguistica. Retrieved from https://apl.pt/wp-content/uploads/2017/12/2003-45.pdf