Descrição:
O Spoken Corpus Mozambique 1986-87 (SCM) é um recurso linguístico da “Cátedra de Português Língua Segunda e Estrangeira”, patrocinada por UEM e Camões-Instituto da Cooperação e da Língua.
Trata-se de um corpus monolingue de português de Moçambique, com cerca de 140.000 palavras, constituído por 40 entrevistas, realizadas em 1986-87.
O SCM pode ser pesquisado na plataforma CQPWeb na página do CLUL. Está também disponível na META-SHARE, uma plataforma europeia de distribuição de recursos linguísticos e ferramentas, com uma licença Metashare Commons-BY-SA.
Constituição do corpus
O SCM foi recolhido por Perpétua Gonçalves, em 1986-87, no âmbito da realização da sua tese de doutoramento, A construção de uma gramática do Português em Moçambique: Aspectos da estrutura argumental dos verbos (Universidade de Lisboa, 1991).
O corpus é constituído por 40 entrevistas (registadas em 48 ficheiros de texto transcrito) feitas a estudantes da Faculdade de Educação da Universidade Eduardo Mondlane que, na altura da recolha, frequentavam o Curso de Formação de Professores de Português de 7ª, 8ª e 9ª classes. Algumas destas entrevistas podem ser consultadas, a pedido, em formato audio.
Os inquiridos foram informados sobre o objetivo geral da pesquisa - um estudo sobre a sintaxe do português de Moçambique - e os temas a abordar foram escolhidos previamente. Trata-se, assim, de um corpus semi-espontâneo, em que, dado o objetivo da pesquisa, se pretendia que os inquiridos produzissem sequências discursivas longas.
O critério que presidiu à seleção dos inquiridos foi a diversidade das suas línguas maternas, da família bantu, de forma a obter uma amostra tão representativa quanto possível da diversidade linguística de Moçambique. Assim, apesar dos limites decorrentes do facto de a recolha ter sido realizada num universo relativamente restrito de indivíduos, o SCM foi produzido por falantes de 11 línguas bantu moçambicanas, para além do português e do suaíli, a seguir discriminadas: ronga/changana - 16 inquiridos (40%); cindau - 5 (12,5%); xitshwa - 4 (10%); macua - 3 (7,5%); sena - 3 (7,5%); chope - 2 (5%); português - 2 (5%); chuabo - 1 (2,5%); nyungwe - 1 (2,5%); maconde - 1 (2,5%); suaíli - 1 (2,5%); cimanyika - 1 (2,5 %).
A idade dos inquiridos oscila entre 19 e 22 anos, e, na maior parte (cerca de 90%), estes são do sexo masculino.
Os dados de cada informante podem ser consultados aqui.