PREPLEXOS

PREPLEXOS - Predicados Complexos: Tipologia e Anotação de Corpus

Concluído
Data
-
Referencia
PTDC/LIN/68241/2006
Instituição financiadora
FCT – Fundação para a Ciência e a Tecnologia
IR do Projeto
Inês Duarte

Resumo:
Este projecto tem como objectivo apresentar uma abordagem integrada da formação dos predicados complexos, que permita dar conta destas construções em português europeu, mais especificamente das suas propriedades sintáctico-lexicais e da sua interpretação. Os resultados da análise baseiam-se em dados extraídos de um corpus com 1 milhão de palavras, de português escrito e falado, anotado com categorias morfo-sintácticas, lematizado e revisto manualmente. Um novo nível de anotação foi acrescentado a este corpus, de acordo com a tipologia de construções com predicados complexos entretanto definida.
São analisados quatro tipos específicos de construções com predicados complexos. Uma construção envolvendo dois verbos principais (fazer rir x), que levanta determinadas questões: a natureza categorial do domínio encaixado, a caracterização dos seus núcleos funcionais, a interface sintaxe-semântica, o impacto do predicado infinitivo na interpretação temporal, bem como o papel das formas verbais finitas e infinitivas no tipo aspectual do conjunto da construção.
O segundo tipo de construção envolve verbos geralmente designados como "verbos leves" seguidos de nome derivado (dar um passeio) ou de um nome que expressa uma emoção, chamado nome psicológico (ter medo). É importante determinar a natureza exacta da contribuição semântica do verbo leve e do predicado secundário, bem como aferir as semelhanças e diferenças entre a construção com verbo leve e a correspondente construção verbal, caso esta exista (dar um passeio, passear). Serão ainda observadas possíveis restrições de selecção nestas construções, bem como restrições no que respeita à selecção de tempo.
O terceiro tipo de construção é constituído por verbo leve seguido de um predicado secundário: um adjectivo (tornar credível) ou um sintagma preposicional (fazer x em pedaços). A análise das ocorrências no corpus da construção com verbo leve e adjectivo permitirá identificar subclasses lexicais e aspectuais dos adjectivos que podem ocorrer como predicados secundários (por exemplo, eventivo vs. estativo, stage-level vs. individual-level). Uma abordagem destes diferentes tipos de construções permitirá estabelecer propriedades definidoras de um verbo leve e de uma construção com predicado complexo.
Finalmente, as propriedades das construções com verbos seriais em que ocorrem dois verbos concatenados (O Pedro pegou e despediu-se), nomeadamente o facto de os dois verbos se combinarem para formar um único predicado semântico e expressar um único evento, levantam a questão de saber se esta construção do português é um caso de coordenação ou um tipo específico de construção com predicado complexo.
A comparação das propriedades destas construções com as de outras línguas românicas e com as do inglês é outro dos objectivos deste projecto.

Estas construções com predicados complexos são estudadas com base em dados extraídos do corpus CINTIL, de 1 milhão de palavras, constituído no Centro de Linguística da Universidade de Lisboa (CLUL) a partir de um corpus de grandes dimensões, o Corpus de Referência do Português Contemporâneo, actualmente com 330 milhões de palavras. O corpus CINTIL tem uma constituição diversificada, com aproximadamente a mesma percentagem de textos escritos e orais, e foi morfo-sintacticamente anotado, lematizado e revisto manualmente, no âmbito de uma parceria entre o grupo NLX - Natural Language and Speech da Faculdade de Ciências da Universidade de Lisboa e o CLUL (o corpus anotado CINTIL pode ser pesquisado online). No âmbito do projecto PREPLEXOS, o corpus CINTIL foi anotado com informação sobre os vários tipos de predicados complexos. Este novo nível de anotação poderá ser de grande importância para uma futura anotação a nível sintáctico e semântico. O corpus anotado será futuramente disponibilizado para consulta de concordâncias.
Os resultados deste projecto serão um contributo para estabelecer as propriedades definidoras destas construções em português, fornecendo igualmente informação importante para uma perspectiva contrastiva.

Gonçalves, A., Oliveira, F., Miguel, M., Mendes, A., Cunha, L. F., Silvano, P., et al. (2010). Propriedades Predicativas dos Verbos Leves Dar, Ter e Fazer: Estrutura Argumental e Eventiva. In P. C. López, Ansoar, S. C., Quiroga, B. D., López, I. F., & Varela, L. Z. (Eds.), Actas del XXXIX Simpósio de la Sociedad Española de Lingüística. Santiago de Compostela: Unidixital (CD-Rom).
Gonçalves, A., Cunha, L. F., & Silvano, P. (2010). Interpretação temporal dos domínios infinitivos na construção de reestruturação do Português europeu, in Textos Seleccionados do XXV Encontro Nacional da Associação Portuguesa de Linguística. In (pp. 435-447). Brito, F. Silva, J. Veloso & A. Fiéis. Porto: APL.
Hendrickx, I., Mendes, A., Pereira, S., Gonçalves, A., & Duarte, I. (2010). Complex Predicates annotation in a corpus of Portuguese. In Proceedings of the fourth Linguistic Annotation Workshop (LAW IV), Association for Computational Linguistics, Uppsala, Sweden (pp. 100-108). Retrieved from https://www.aclweb.org/anthology/W10-1812.pdf
Mendes, A., & Pereira, S. (2010). Anotação de predicados complexos num corpus de português. In Actas del XXXIX Simpósio de la Sociedad Española de Lingüística (P. C. López, S. C. Ansoar, B. D. Quiroga, I. F. López, L. Z. Varela). Santiago de Compostela: Unidixital (CD-Rom).
Duarte, I., Colaço, M., Gonçalves, A., Mendes, A., & Miguel, M. (2009). Predicados complexos do tipo light verb+deverbal noun. Arena Romanistica 2009, 4, 48-57.
Duarte, I., Colaço, M., Gonçalves, A., Mendes, A., & Miguel, M. (2009). Lexical and syntactic properties of complex predicates of the type "light verb+deverbal noun". Arena Romanistica, 4, 48-57.