Corpora di lingua spagnola

Corpus del español
Il corpus contiene 100 milioni di parole di lingua spagnola scritta e orale dal 1200 ad oggi. Il corpus, che mette insieme una serie di corpora di origine diversa preparati negli anni, è stato ideato e gestito da Mark Davies.
URL: http://www.corpusdelespanol.org/

Mark Davies ha anche costruito altri corpora tra cui un corpus di spagnolo storico (1200-1800, 4.000 testi), versioni spagnole della Bibbia (1.000.000 di parole), linguaggio giornalistico contemporaneo dello spagnolo latino-americano (35.000.000 di parole), testi letterari spagnoli e argentini, conversazioni parlate in spagnolo contemporaneo (2.500.000 parole di spagnolo anche latino-americano, e 1.000.000 di parlato spagnolo). Una lista di link a materiali relativi a questi corpora si può trovare online.

Il Corpus de Referencia de la Lengua Española Contemporánea (CREA) della Real Academia Española annovera 100 milioni di parole tratte da testi scritti e parlati (trascritti) dal 1975 ad oggi.

TREC Spanish Corpus (TREC) prodotto dal Linguistic Data Consortium (LDC).
URL: http://trec.nist.gov/.

Corpus chileno

Corpus argentino

Corpus oral peninsular

[top]