Liste di frequenza e concordanze

Per segnalare eventuali broken links, o siti di corpora significativi delle lingue trattate scrivete aisabella chiari.

CONCAPP

OS: Windows (NT//98/2000/ME/XP)
Licenza: gratuito

ConcApp è un programma per Windows (NT//98/2000/ME/XP) svolge concordanze e produce liste di frequenza sulla maggioranza delle lingue europee e sul cinese e il giapponese (opzione raramente supportata dai programmi simili). I file di input possono anche essere più di uno, si possono salvare le liste in formato solo testo, si possono anche trovare alcune elementari collocazioni. L’interfaccia è immediata, l’accesso alle funzioni avviene attraverso menu standard.

Non è un programma particolarmente veloce nel processamento, rispetto ad altri programmi simili ha relativamente poche funzioni (per esempio non può trattare stoplist e la personalizzazione dei caratteri), inoltre la guida in linea è poverissima, in compenso però il software è completamente gratuito. Una versione di Concapp può essere scaricata al sito.

URL: http://www.edict.com.hk/PUB/concapp/concapp.zip

[top]

CONCORDANCE

OS: Windows (NT//98/2000/ME/XP)
Licenza: $89

Concordance è un programma di analisi di testi molto flessibile. Si installa su sistema operativo Windows (NT/95/98/2000/ME/XP), quindi comparativamente a LEXA e TACT possiede un’interfaccia più semplice ed integrabile con altri programmi di grande diffusione. Concordance permette di generare liste di frequenza in tempi brevissimi, da corpus illimitati definiti dall’utente (dati in formato txt, ossia solo testo non formattati). Genera concordanze generali e concordanze basate su specifici criteri di ricerca. Permette il salvataggio in diversi formati, la stampa e la pubblicazione su web di tutti i risultati prodotti. Una caratteristica particolarmente utile è la possibilità di usare corpus con alfabeti diversi (e di definire pick lists e stoplists), anche definiti dall’utente. Le modalità di ricerca permettono anche l’uso delle espressioni regolari. Come tutti i programmi flessibili richiede la lettura attenta del manuale per capire le potenzialità funzionali complete del programma. L’interfaccia e l’analisi sono tuttavia relativamente semplici da apprendere. Viene distribuito in una versione dimostrativa pienamente funzionale, con validità di 30 giorni, completa di manuale molto dettagliato al sito.

Alla registrazione del prodotto, che si può fare online, l’utente ottiene una chiave per sbloccare il demo. Il costo per un utente privato è di circa £55, o $89.

URL: http://www.rjcw.freeserve.co.uk/

[top]

MONOCONC

OS: Windows (NT//98/2000/ME/XP)
Licenza: $79

MonoConc è un programma interattivo per Windows molto agile e veloce. Il programma è di fascia medio/alta in quanto a prestazioni. Per quanto riguarda le ricerche di stringhe supporta le espressioni regolari, e la ricerca di etichette (se il corpus è già etichettato). Il programma permette la personalizzazione dell’alfabeto di caratteri usato (le norme per esempio su cosa considerare confine di parola, ecc.), esegue concordanze, liste di frequenza, ricerche avanzate. Il programma costa circa $79. Per informazioni visitare il sito:

URL: http://www.ruf.rice.edu/~barlow/mono.html

[top]

TACT

OS: DOS
Licenza: gratuito

TACT ( Textual Analysis Computing Tools ) è uno dei programmi più noti e diffusi per l’analisi dei testi. Funziona su sistema operativo DOS, dunque ha una interfaccia un po’ obsoleta, e un accesso alle funzioni più rudimentale (non supporta il mouse). Si tratta però di un programma molto flessibile e ricco che produce liste di frequenza, concordanze KWIC, grafici di distribuzioni e collocazioni. Si tratta in realtà di un pacchetto di 16 programmi integrati. A prima vista il programma può scoraggiare l’utente, ma in realtà possiede una serie di funzionalità che in genere non sono contenute in un solo pacchetto.

Con TACT si possono annotare i testi, creare database testuali, condurre analisi e ricerche anche con espressioni regolari (con Usebase), analizzare statistiche sulla lunghezza delle parole e sulla frequenza delle parole (Tactstat), produrre liste di frequenza ( tactfreq), analisi di anagrammi, calcolo delle collocazioni con un indice specifico sul rapporto fra le parole, e altro. È disponibile anche una versione consultabile online del programma, Tactweb (http://tactweb.humanities.mcmaster.ca/tactweb/doc/tact.htm). Il software è distribuito gratuitamente online con un manuale purtroppo insufficiente.

URL : http://www.chass.utoronto.ca/cch/tact.html

[top]

WORDSMITH TOOLS

OS: Windows 98/2000/XP
Licenza: versione BETA

Wordsmith Tools (versione 4) è un pacchetto completo e flessibile per l’elaborazione di concordanze, liste di frequenza e interrogazioni complesse. Si tratta di una serie integrata di programmi a 32-bit, che lavora sotto sistema operativo Windows 98/2000/XP. Gli strumenti principali sono Concord, Keywords e Wordlist, cui si aggiungono alcune utilities (allineamento, analisi dei caratteri del testo, individuazione di coppie minime, ecc.), tutti con un’interfaccia user-friendly. Concord permette di generare concordanze usando files in formato dos, ansi e solo testo, permette inoltre di trovare le collocazioni, patterns e clusters; Keywords permettte di individuare le parole-chiave dei testi del corpus; Wordlist invece produce liste di frequenza, con la possibilità di condurre alcune analisi statistiche, lemmatizzazioni, comparazioni tra liste, ecc. Il pacchetto permette di selezionare le diverse lingue (con i rispettivi principi di ordinamento alfabetico), riconosce i principali sistemi di annotazione e permette ricerche sui tags, permette la predisposizione di stop lists e lemma lists, di calibrare i contesti delle concordanze, l’attivazione/disattivazione della case-sensitivity, e molto altro.

Complessivamente si tratta di uno dei pacchetti più versatili e ricchi, poco costosi a disposizione ed è inoltre largamente usato in studi scientifici. La versione attuale di Wordsmith Tools è scaricabile gratuitamente da Internet e necessità dell’inserimento di una chiave di registrazione per avere accesso alle piene funzionalità. Al momento la versione attuale (4) è considerata come beta (versione di prova) e dunque viene fornita completa senza la necessità di pagare la registrazione. Si tratta però di un vantaggio temporaneo, che presto sarà sostituito da una licenza commerciale.

URL : http://www.lexically.net/wordsmith/version4/index.htm

[top]

CONTEXTES

OS: Windows 2000/XP
Licenza: versione DEMO

Contextes (v1.1.0) è un pacchetto per svolgere concordanze (usato ad esempio per interrogare il corpus multilingue CORALROM), elaborato da Jean VÉRONIS. E' possibile costruire corpora a sezioni, operare interrogazioni su parole e con espressioni regolari e indicazioni sul cotesto. E' inoltre possibile allineare i testo a files audio corrispondenti a varie sezioni, esportazione in txt ed Excel. Si tratta di un software adatto a interrogazioni semplici e di base (nessuna elaborazione statistica, nessuno strumento linguistico è contenuto nel pacchetto). Download demo (visualizza solo 50 risultati per ogni interrogazione).

URL: http://www.up.univ-mrs.fr/veronis/logiciels/Contextes/index-en.html