Zur Navigation | Zum Inhalt
FVCML0208 10
Introduzione all’analisi automatica dei testi e ai metodi e modelli di text mining PDF Stampa E-mail
Domenica 10 Ottobre 2010 14:53

La scuola internazionale di “Introduzione all’analisi automatica dei testi e ai metodi e modelli di text mining” (corso ADT-TM) si svolgerà a Roma dal 10 al 15 gennaio 2011. Si tratta di una iniziativa nata nel corso delle ultime giornate internazionali JADT2010 ( http://jadt2010.uniroma1.it/it/index.html) che si sono svolte a Roma nel giugno scorso.
L’obiettivo del corso è di fornire strumenti di analisi statistica per la gestione di informazioni non strutturate, con un approccio multidisciplinare. La scuola è rivolta a dottorandi, ricercatori e studiosi di tecniche di analisi dei dati testuali o a quanti vogliono iniziare a occuparsi di questi temi.


Il corso si articola in due moduli: 1) analisi automatica dei testi; 2) metodi, modelli e strumenti di text mining.
 
Nella prima parte del corso, si presentano le basi dell’analisi lessico-testuale del contenuto, che consentono di esplorare e interrogare raccolte di testi come basi documentali, interviste, rassegne stampa, domande aperte in indagini con questionario, forum, newsgroup altro. In particolare, si illustrano i processi di individuazione dell’unità di analisi, di ponderazione delle parole in funzione di differenti obiettivi, di strumenti per la formulazione di modelli di estrazione di entità e di costruzione di risorse per l’analisi automatica del contenuto. In questa parte, l’attenzione è rivolta anche alle applicazioni nel Web 2.0, all’analisi semantica a partire da caratteristiche distribuzionali di raccolte di documenti, ai confronti lessicali e alle comparazione di vocabolari.
 
Nella seconda parte del corso, si analizzano tecniche sia classiche che più recenti per la classificazione automatica e l’estrazione di informazione, con particolare attenzione all’introduzione di informazione esterna e alla visualizzazione del contenuto di tabelle lessicali. Si illustrano, inoltre, anche le tecniche di Social Network Analysis per descrivere pattern di testi e di parole e per classificare i documenti a partire dalla centralità che assumono le parole in un testo.
Entrambi i moduli prevedono un’illustrazione degli strumenti di software dedicato, fra i quali ad esempio Taltac, Lexico, DTM-Vin, SAS ed R.
 
Il corso ha la durata di 38 ore (2/3 di lezione e 1/3 di illustrazione di casi di studio mediante l’ausilio di software), distribuite su 5 giorni.
La scuola è organizzata dal dipartimento MEMOTEF (Metodi e modelli per l'economia, il territorio e la finanza) dell’Università “Sapienza” di Roma. La scheda dettagliata della scuola sarà disponibile a partire dal 18 ottobre sul sito web dei corsi del Dipartimento: http://www.memotef.uniroma1.it/corsi/
 
Fra i docenti figurano: Simona Balbi, Marco Baroni, Sergio Bolasco, Luca Giuliano, D. Fioredistella Iezzi, Ludovic Lebart, André Salem, Arjuna Tuzzi, M. Fabio Zanzotto.
 
Se pensate di voler partecipare, vi chiediamo di manifestarci fin da subito il vostro interesse per il corso inviandoci una mail di risposta a questa call e vi preghiamo di compilare il modulo di iscrizione non appena disponibile sul sito. La quota di iscrizione vi sarà richiesta non appena il corso verrà confermato, avendo raggiunto il numero minimo di partecipanti.
Invitandovi a diffondere intorno a voi questo annuncio, prendiamo l'occasione per inviarvi i nostri più cordiali saluti
 
Stella Iezzi e Sergio Bolasco

Ultimo aggiornamento Domenica 10 Ottobre 2010 14:56