Gramática & Recursos
Este grupo centra-se na modelação do conhecimento linguístico integrando conhecimento sobre interfaces entre diferentes áreas da gramática e conhecimento sobre o uso da língua. O grupo tem como característica distintiva o trabalho conjunto nas áreas da fonologia, do léxico, da sintaxe e da semântica, com o objetivo de construir um modelo integrado de gramática, considerando a forma como o conhecimento linguístico é representado na mente humana, bem como a forma como esse conhecimento poderá ser modelado computacionalmente; o trabalho sobre a aquisição de L1 e L2 está naturalmente no centro deste programa de investigação. A integração de modelos de representação do conhecimento linguístico e de modelos de uso da língua é conseguida através do estudo de corpora.
A produção de corpora e recursos em geral serve ainda o objetivo do grupo de produzir documentação e descrições do português europeu contemporâneo, bem como de línguas menos estudadas que resultam de contacto linguístico (crioulos de base lexical portuguesa, variedades nacionais do português em África e na Ásia). O grupo produz ainda recursos para o estudo da aquisição do português como L1 e como L2 em diferentes situações de aquisição. O grupo integra o CLARIN LP.
A investigação desenvolvida por vários membros do grupo na área da aquisição de L1 e L2 contribui diretamente para o objetivo geral do CLUL de articulação entre investigação fundamental e aplicada, nomeadamente nas áreas da Linguística Educacional e da Linguística Clínica.
São, atualmente, grandes objetivos do grupo:
- Produzir novos recursos para o estudo do português e de crioulos de base lexical portuguesa;
- Continuar investigação fundamental que visa a modelação do conhecimento linguístico, integrando conhecimento sobre interfaces internas à gramática;
- Continuar a documentação e descrição de crioulos e novas variedades do português que emergiram em situação de contacto de línguas;
- Desenvolver o estudo da aquisição do português, dando especial atenção a situações de contacto linguístico (no âmbito do recente Heritage Language Consortium) e à comparação entre desenvolvimento típico e atípico;
- Explorar a potencialidade da linguística comparada para a produção de recursos para a tradução e promover, na mesma área, ligações à indústria.
Membros
Investigadores integrados com doutoramento
Investigadores integrados sem doutoramento
Colaboradores
Concluídos
Projeto | Data | Fin. |
---|---|---|
ParlaMint II - ParlaMint II | - | |
PALMA - Posse e Localização: Microvariação em variedades africanas do português (PALMA) | - | FCT
|
RECAP - RECAP: Recursos para a Aprendizagem do Português | - | FCG
|
PORTULAN CLARIN - PORTULAN CLARIN - Infraestrutura para a Ciência e Tecnologia da Linguagem | - | |
Documentation of Sri Lanka Portuguese | - | |
LeCIEPLE - LeCIEPLE - Learner Corpus: da investigação ao ensino de Português Língua Estrangeira/Língua Segunda | - | FCG
|
Crioulos de base portuguesa no espaço dravídico: diacronia e sincronia | - | |
TAXE - TAXE - Parataxe, Hipotaxe e Interface Sintaxe-Discurso | - | |
COPAS - COPAS - Contraste e Paralelismo na Fala | - | |
CLAP - CLAP - Completivas na Aquisição do Português | FCT
|
|
SemiAutLex.PT - SemiAutLex.PT - construção semi-automática de léxicos relacionais para o Português | - | FCT
|
SynExtract - SynExtract - extracção automática de relações de sinonímia para a aquisição eficiente de recursos lexicais | - | FCT
|
(2016). Investigação interdisciplinar em fonética forense: estudo de caso de identidade e disfarce de voz. In Actas da II Conferência do Instituto Medicina Legal e Ciências Forenses, 29-30 de Setembro 2015, Coimbra (Vol. 2015, pp. 60-61). . |
(2016). CEPLEXicon – A Lexicon of Child European Portuguese. In Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), May 23-28, Portorož, Slovenia (Calzolari, N. and K. Choukri and T. Declerck and S. Goggi and M. Grobelnik and B. Maegaard and J. Mariani and H. Mazo and A. Moreno and J. Odijk and S. Piperidis). . |
(2016). Using syntactic and semantic features for classifying modal values in the Portuguese language. In Proceedings of CICLing-16, 17th international Conference on Intelligent Text Processing and Computational Linguistics. Lecture Notes in Computer Science. Springer. . |
(2017). Using error annotation to evaluate machine translation and human post-editing in a business environment. In 20th Annual Conference of the European Association for Machine Translation – EAMT 2017 (pp. 68-73). Praga, República Checa. Retrieved from https://pdfs.semanticscholar.org/c9d2/8db57b3cedfd75a2fe694dcc59ba8caf7029.pdf . |
(2017). Error detection and error correction for improving quality in machine translation and human post-editing. In 20th International Conference on Intelligent Text Processing and Computational Linguistics – CICLing 2017, reprinted in International Journal of Computer Applications. Retrieved from https://repositorio.ul.pt/bitstream/10451/33007/1/error%20detection_Comparin%26Mendes2017.pdf . |
(2017). The Annotation Coreference Task at IberEval’2017: The experience of CLUL/UE. In Proceedings of the Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval’2017), co-located with 33rd Conference of the Spanish Society for Natural Language Processing (SEPLN 2017). Murcia, Spain. . |
(2014). Tagging and Labeling Portuguese Modal Verbs. In J. Baptista & Mamede, N. (Eds.), PROPOR 2014 - LNCS 3960. Springer-Verlag. (Original work published oct) . |
(2014). An Evaluation of the Role of Statistical Measures and Frequency for MWE Identification. In Proceedings of the Ninth International Conference on Language Resources and Evaluation – LREC’14, May 26-31, Reykjavik, Iceland (pp. 4046-4051). . |
(2014). The Gulf of Guinea Creole Corpora. In Proceedings of the Ninth International Conference on Language Resources and Evaluation – LREC’14, May 26-31, Reykjavik, Iceland (pp. 523-529). . |
(2014). Automatic tagging of modality: identifying triggers and modal values. In H. Bunt (Ed.), Proceedings 10th Joint ISO - ACL SIGSEM Workshop on Interoperable Semantic Annotation (pp. 95-101). . |
(2013). Experiments in synonymy: weakly supervised term matching to concepts. In Proceedings of the 10th International Conference on Terminology and Artificial Intelligence (pp. 181-184). (Original work published oct) . |
(2013). MWE in Portuguese: proposal for a typology for annotation in running text. In The 9th Workshop on Multiword Expressions (MWE 2013), Workshop at NAACL 2013. (Original work published jun) . |
(2013). Annotating the Interaction between Modality and Focus: the case of exclusive particles. In Proceedings of the 7th Linguistic Annotation Workshop and Interoperability with Discourse (LAW VII), Association for Computational Linguistics, August 8-9 2013, Sofia, Bulgaria (pp. 228-237). . |
(2012). CQPWeb: Uma nova plataforma de pesquisa para o CRPC. In A. L. Costa, Flores, C., & Alexandre, N. (Eds.), XXVII Encontro Nacional da Associação Portuguesa de Linguística. Textos Seleccionados 2011. Lisboa: APL. . |
(2012). Modality in Text: a proposal for corpus annotation. In Proceedings of the Eighth International Conference on Language Resources and Evaluation - LREC 2012, May 21-27 2012, Istanbul (pp. 1805-1812). . |
(2012). Introducing the Reference Corpus of Contemporary Portuguese On-Line. In Proceedings of the Eighth International Conference on Language Resources and Evaluation - LREC 2012, May 21-27 2012, Istanbul (pp. 2237-2244). . |
(2012). A Large Portuguese Corpus On-Line : Cleaning and Preprocessing. In Computational Processing of the Portuguese Language. Proceedings of the 10th International Conference PROPOR1012 (H. Caseli et al., pp. 113-120). Berlin, Heidelberg: Springer-Verlag. . |
(2012). Fenómenos de concordância em variedades do português: construções com verbos copulativos e com verbos transitivos predicativos. In La lengua, lugar de encuentro, Actas del XVI Congresso Internacional de la ALFAL (Cestero Mancera, A. M., I. M. Martos, F. P. Garcia). . |
(2010). Complex Predicates annotation in a corpus of Portuguese. In Proceedings of the fourth Linguistic Annotation Workshop (LAW IV), Association for Computational Linguistics, Uppsala, Sweden (pp. 100-108). . |
(2010). Proposal for Multi-word Expression annotation in running text. In Proceedings of the fourth Linguistic Annotation Workshop (LAW IV), Association for Computational Linguistics, Uppsala, Sweden (pp. 152-156). . |
(2010). Lexical analysis of pre and post revolution discourse in Portugal. In Proceedings of the Third Workshop on Building Comparable Corpora, 7th International Conference on Language Resources and Evaluation (LREC 2010), Malta. . |
(2010). Propriedades Predicativas dos Verbos Leves Dar, Ter e Fazer: Estrutura Argumental e Eventiva. In P. C. López, Ansoar, S. C., Quiroga, B. D., López, I. F., & Varela, L. Z. (Eds.), Actas del XXXIX Simpósio de la Sociedad Española de Lingüística. Santiago de Compostela: Unidixital (CD-Rom). . |
(2010). Anotação de predicados complexos num corpus de português. In Actas del XXXIX Simpósio de la Sociedad Española de Lingüística (P. C. López, S. C. Ansoar, B. D. Quiroga, I. F. López, L. Z. Varela). Santiago de Compostela: Unidixital (CD-Rom). . |
(2009). Predicados complexos do tipo "verbo leve-nome derivado": uma análise baseada em corpora. In D. da Hora (Ed.), Anais do VI Congresso Internacional da Abralin (D. da Hora, pp. 1858-1867). Idéia. . |
(2008). Corpus annotation and lexical analysis of African varieties of Portuguese. In V. Lyding (Ed.), Proceedings of LULCL II - Lesser Used Languages and Computer Linguistics (V. Lyding, pp. 43-57). Bolzano: Institute for Specialised Communication and Multilingualism. . |
(2008). On the use of comparable corpora of African varieties of Portuguese for linguistic description and teaching/learning applications. In P. Zweigenbaum (Ed.), Proceedings of the Workshop on Building and Using Comparable Corpora. VI Language Resources and Evaluation Conference - LREC2008 (P. Zweigenbaum et al., pp. 39-46). Marrakech. . |
(2006). Linguistic Resources and Software for Shallow Processing. In F. Oliveira, Barbosa, J., & Oliveira, F. (Eds.), Actas do XXI Encontro Nacional de Linguística (pp. 203-217). Lisboa: Associação Portuguesa de Linguística. . |
(2006). A Lexical Database of Portuguese Multiword Expressions. In R. Vieira (Ed.), PROPOR 2006 - LNCS 3960 (pp. 238-243). Berlin: Springer-Verlag. . |
(2006). Open Resources and Tools for the Shallow Processing of Portuguese: the TagShare project. In Proceedings of the V International Conference on Language Resources and Evaluation - LREC2006, May 22-28 2006, Genoa. . |
(2006). COMBINA-PT: a Large Corpus-extracted and Hand-checked Lexical Database of Portuguese Multiword Expressions. In Proceedings of the V International Conference on Language Resources and Evaluation - LREC2006, May 22-28 2006, Genoa. . |