Relações discursivas e marcadores discursivos
Este projeto agrega vários trabalhos na área dos estudos do discurso:
(i) análise das relações discursivas (ou relações retóricas ou relações de coerência) intrafrásicas e interfrásicas que ocorrem entre dois argumentos proposicionais, marcada de forma explícita por um conetor ou de forma implícita, sendo então o significado da relação inferido a partir do cotexto. (Financiamento: PORTULAN CLARIN)
Recursos:
- CRPC-DB, um banco do discurso para o português: corpus anotado com relações discursivas (discourse bank), que aplica o modelo de anotação do Penn Discourse Treebank (Prasad et al., 2008) sobre um conjunto de textos do Corpus de Referência do Português Contemporâneo - CRPC.
- subcorpus português do TED-MDB, um corpus paralelo anotado com relações discursivas. O corpus, constituído por 6 TED Talks, inclui a transcrição original do inglês e sua tradução para 6 línguas: alemão, lituano, polaco, português, russo e turco. O trabalho foi desenvolvido no âmbito da participação do CLUL na ação COST TextLink, Structuring Discourse in Multilingual Europe.
(ii) análise de marcadores discursivos do português e suas funções proposicionais, estruturais e pragmáticas.
Recursos:
- LDM-PT, um léxico de marcadores discursivos do português.
- integração do LDM-PT no léxico multilíngue de conetores discursivos, Connective-Lex.
(2020). TED-MDB Lexicons: Tr-EnConnLex, Pt-EnConnLex. In Proceedings of the First Workshop on Computational Approaches to Discourse (Chloé Braud et al., Eds., pp. 148-153). Association for Computational Linguistics. . |
(2020). TED Multilingual Discourse Bank (TED-MDB): a parallel corpus annotated in the PDTB style. Language Resources And Evaluation, 54 (2), 587-613. http://doi.org/https://doi.org/10.1007/s10579-019-09445-9 . 10579_2019_9445_OnlinePDF-3.pdf457.98 KB
|
(2020). Perguntas-respostas em textos escritos: uma análise no âmbito das relações discursivas. Revista Da Associação Portuguesa De Linguística, 7, 226-241. http://doi.org/10.26334/2183-9077/rapln7ano2020a14 . |
(2019). Connective-lex: A web-based multilingual lexical resource for connectives. Discours, 24. . |
(2018). Multilingual Extension of PDTB-Style Annotation: The Case of TED Multilingual Discourse Bank. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published May 7-12, 2018) . |
(2018). Corref-PT: A Semi-Automatic Annotated Portuguese Coreference Corpus. Computación Y Sistemas, 22(4). http://doi.org/10.13053/cys-22-4-3063 . |
(2018). Discourse relations with explicit and implicit arguments: The case of European Portuguese aliás. In Proceedings of the Cross-Linguistic Discourse Annotation: Applications and Perspectives, Final Action Conference TextLink. Toulouse. . |
(2018). A Lexicon of Discourse Markers for Portuguese-LDM-PT. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan: European Language Resources Association (ELRA). (Original work published may) . |
(2018). Using a Discourse Bank and a Lexicon for the Automatic Identification of Discourse Connectives. In Computational Processing of the Portuguese Language, PROPOR 2018 (pp. 211-221). Springer International Publishing. . |
(2018). Designing a corpus-based lexicon for spoken DRDs: semantic considerations. In Proceedings of the Cross-Linguistic Discourse Annotation: Applications and Perspectives, Final Action Conference TextLink (L.M. Ho-Dac & Phillip Mueller, Eds., pp. 29-33). University of Toulouse. . |
(2016). Some considerations on the use of main verbs to express rhetorical relations. In L. Degand, Dér, C., Furkó, P., & Webber, B. (Eds.), Conference Handbook of TextLink – Structuring Discourse in Multilingual Europe Second Action Conference (pp. 11-14). Budapest: Debrecen University Press. (Original work published apr) . |