French - English Parallel Corpus (BAF)è un corpus di testi istituzionali paralleli (mutue traduzioni) di inglese e francese.
BoLC Italian - English Comparable Corpus (Bononia Legal Corpus) è un corpus multilingue di testi di tipo giuridico di lingua italiana e inglese, sviluppato e coordinato da R. Rossini Favretti.
CALLHOME project è un corpus multilingue di parlato conversazionale, che copre spagnolo, cinese, giapponese, inglese americano, tedesco ed arabo.
Child
Language Data Exchage System (CHILDES) è un grande
progetto finalizzato alla composizione di un corpus del parlato
dei bambini,
delle conversazioni con bambini e di alcune patologie del linguaggio
(http://childes.psy.cmu.edu/).
URL: http://childes.psy.cmu.edu/html/database.html.
C-ORAL-ROM è un progetto di costruzione di un corpus di parlato spontaneo di quattro lingue romanze (italiano, francese, portoghese, spagnolo), coordinato da LABLITA.
CRATER è un corpus trilingue di inglese, francese e spagnolo.
European Corpus Initiative Multilingual Corpus (ECI/MCI) è un’iniziativa del 1994 che ha lo scopo della creazione e diffusione di corpus multilingue.
INTERSECT (International Sample of English Contrastive Texts) è un progetto dell’università di Brighton per la costruzione e analisi di testi scritti paralleli Inglese-Francese.
Korpus romanischer Zeitungssprachen (Französisch, Italienisch, Spanisch)
MULTEX (Multilingual Text Tools and Corpora) è un progetto complessivo che mira alla definizione di standard per la codifica dei corpora, per lo sviluppo di strumenti applicativi e risorse multilingui.
REAL Parallel Corpus (German-English Translation Corpus) raccoglie testi paralleli in inglese (americano e britannico) e tedesco.
TRIPTIC (TRIlingual Parallel Text Information Corpus) è un corpus di inglese, francese e olandese composto da circa 2 milioni di parole, in testi paralleli allineati.
TRACTOR (TELRI Research Archive of Computational Tools and Resources) è un progetto mantenuto dal Centre for Corpus linguistics dell’università di Birmingham. Si tratta di un archivio di materiali e software per l’analisi di corpora. Tra le lingue trattate ci sono le principali lingue europee e anche bulgaro, ceco, le lingue baltiche, rumeno, russo e altre.
[top]
