Zur Navigation | Zum Inhalt
FVCML0208 10
Corpora di lingua italiana / Italian corpora


TLIO Tesoro della lingua italiana delle origini PDF Stampa E-mail
Mercoledì 29 Aprile 2009 19:14

Tesoro della lingua italiana delle origini (TLIO) è un database testuale (nato nel 1995 e inaugurato nel 1998) composto da circa 1.780 testi per circa 20 milioni di parole, tratte da scritti in lingua italiana prima del 1375, in prosa e in poesia. Una prima versione della banca dati fu implementata in dbt di Eugenio Picchi. Il database è interrogabile online con registrazione gratuita al sito dell'Istituto Opera del Vocabolario Italiano (OVI):

http://tlio.ovi.cnr.it/TLIO/

 
LIZ Letteratura Italiana Zanichelli PDF Stampa E-mail
Mercoledì 29 Aprile 2009 18:02

LIZ 4.0. LETTERATURA ITALIANA ZANICHELLI  CD-ROM dei testi della letteratura italiana. Quarta edizione per Windows. A cura di Pasquale Stoppelli ed Eugenio Picchi.

Sistema di interrogazione DBT in collaborazione con il Consiglio Nazionale delle Ricerche. Con il volume Schede di letteratura italiana; 1000 opere, 245 autori, 2001

LIZ

  http://www.zanichelli.it/index.asp

 

 
LIR PDF Stampa E-mail
Mercoledì 29 Aprile 2009 18:00

Lessico di frequenza dell'italiano radiofonico (LIR) è un progetto di analisi del lessico e del corpus del parlato radiofonico, diretto da Nicoletta Maraschio, in 2 DVD ed è pubblicato dall'Accademia della Crusca."I due DVD contengono due corpora di italiano radiofonico raccolti a quasi dieci anni di di-stanza, una prima volta nel 1995 e poi nel 2003. Il corpus del LIR1 (1995) raccoglie circa 64 ore di parlato radiofonico, trascritto e in voce, registrato da nove radio a diffusione nazionale [...] può essere interrogato grazie a un potente motore di ricerca come il DBT di Eugenio Picchi" (Maraschio, Stefanelli)


 
LIP Lessico di frequenza dell'italiano parlato PDF Stampa E-mail
Mercoledì 29 Aprile 2009 17:59

Lessico di frequenza dell'italiano parlato (LIP), curato da De Mauro, Mancini, Vedovelli e Voghera (1993) costituisce la controparte del lif per l'italiano parlato. Il corpus da cui è tratto è costituito da circa 500.000 parole grafiche, trascrizioni di registrazioni effettuate a Milano, Firenze, Roma e Napoli, pari a quasi 57 ore di parlato. Le tipologie del parlato rappresentate sono dialoghi faccia a faccia e non, a presa di parola libera e non, monologhi faccia a faccia e non. I lemmi sono consultabili secondo frequenza e secondo ordine alfabetico, vi è anche una lista di frequenza dei fonosimboli e delle polirematiche. Il volume del lessico è corredato da due dischetti che contengono le trascrizioni di tutti i testi del corpus, permettendo dunque a chi voglia svolgere ulteriori analisi l'accesso diretto ai materiali.

http://languageserver.uni-graz.at/badip/badip/20_corpusLip.php

 
LIF Lessico di frequenza della lingua italiana contemporanea PDF Stampa E-mail
Mercoledì 29 Aprile 2009 17:58
Lessico di frequenza della lingua italiana contemporanea (LIF), elaborato nel 1971 al cnuce (Centro Nazionale Universitario di Calcolo elettronico) di Pisa (cfr. Bortolini et alii , 1971). Si tratta del primo grande progetto di costruzione di un lessico di frequenza per la lingua italiana (non tagliato su un singolo autore o su testi specificatamente letterari). Il lessico contiene circa 5.000 lemmi ordinati per frequenza e secondo l'ordine alfabetico, tratti dallo spoglio di testi per un complesso di 500.000 parole. I testi che sono entrati a far parte del corpus sono datati tra il 1947 e il 1968, sono tutti testi scritti, presi da 5 fonti diverse (teatro, romanzi, cinema, periodici, sussidiari), a rappresentare diverse forme testuali alcune delle quali vicine al parlato. Il corpus non è disponibile per la consultazione né offline né online.
 
<< Inizio < Prec. 1 2 3 4 Succ. > Fine >>

Pagina 2 di 4