Corpus
del español
Il corpus contiene 100 milioni di parole di lingua spagnola scritta e orale
dal 1200 ad oggi. Il corpus, che mette insieme una serie di corpora
di origine diversa preparati negli anni, è stato ideato e gestito
da Mark Davies.
URL: http://www.corpusdelespanol.org/
Mark
Davies ha anche costruito altri corpora tra cui un corpus di
spagnolo storico (1200-1800, 4.000 testi), versioni spagnole
della Bibbia (1.000.000
di parole), linguaggio giornalistico contemporaneo dello spagnolo latino-americano
(35.000.000 di parole), testi letterari spagnoli e argentini, conversazioni
parlate in spagnolo contemporaneo (2.500.000 parole di spagnolo anche
latino-americano, e 1.000.000 di parlato spagnolo). Una lista di link
a materiali relativi a questi corpora si può trovare online.
Il Corpus
de Referencia de la Lengua Española Contemporánea (CREA) della Real Academia Española
annovera 100 milioni di parole tratte da testi scritti e parlati
(trascritti) dal 1975 ad oggi.
TREC
Spanish Corpus (TREC) prodotto dal Linguistic Data Consortium
(LDC).
URL: http://trec.nist.gov/.
[top]
