REDIP

REDIP - Rede de Difusão Internacional do Português: rádio, televisão e imprensa

Concluído

Descrição:
Este projecto desenvolveu-se em torno de 2 grandes objectivos:

a) a construção de uma base de dados de amostras de textos difundidos através dos meios de comunicação social, nomeadamente, rádio, TV e imprensa escrita, incluindo: amostras de som e vídeo em formato analógico, amostras de áudio em formato digital (digitalizadas a partir de amostras analógicas) e amostras em formato escrito electrónico (para os materiais da imprensa escrita); transcrição dos textos orais (rádio e TV); anotação morfossintáctica dos materiais; informação sobre frequências e concordâncias para todos os dados.

b) descrição do Português Europeu utilizado nos Media, fornecendo informação acerca das suas propriedades lexicais, gramaticais, semânticas e discursivas. O corpus final tem cerca de 324.000 palavras: 108.000 para cada tipo de media (rádio, TV e imprensa), e está dividido em 6 campos: Economia, Opinião, Desporto, Cultura, Notícias e Ciência, com 54.000 palavras por campo (18.000 palavras por campo em cada tipo de media

Uma descrição mais detalhada do projecto, bem como as publicações com ele relacionadas, pode ser consultada na página do Instituto de Linguística Teórica e Computacional (ILTEC) em http://www.iltec.pt/projectos/concluidos/redip.html.

O corpus REDIP pode ser consultado na página seguinte do ILTEC: http://www.iltec.pt/?action=concord.

Parcerias
ILTEC - Instituto de Linguística Teórica e Computacional
CLUL - Centro de Linguística da Universidade de Lisboa
Universidade Aberta