Tagging e Parsing
[ Annotate ] [ Claws4 ] [ Cosmas II ] [ TreeTagger ] [ Connexor Phrase Tagger ]
Per segnalare eventuali broken links, o siti di corpora significativi delle lingue trattate scrivete a isabella chiari. Ricordo che in queste pagine sono segnalati alcuni programmi sulla base della loro efficienza e facilità d'uso, per ragioni di spazio non è possibile, né sensato citare tutti i prodotti disponibili sul web.
OS: Solaris e Linux
Licenza: -
Annotate è un software che permette l’annotazione semi-automatica di corpus. Si tratta di un applicativo usato nel progetto Negra, che può essere adattato per produrre annotazioni POS, categorie grammaticali e sintattiche. Il programma ha un’interfaccia amichevole, ma gira solo sotto sistemi operativi Solaris e Linux, ed ha manuali solo in tedesco.
URL: http://www.coli.uni-sb.de/sfb378/negra-corpus/
[top]
OS: Windows (NT//98/2000/ME/XP)
Licenza: demo gratuita, servizio a pagamento
CLAWS4 è il software usato per il pos-tagging del British National Corpus. Il programma etichetta ogni token di un corpus di lingua inglese con le rispettive categorie grammaticali sulla base di una strategia probabilistica e raggiunge una percentuale di precisione di circa 96-97%. Per usufruire del tagging il software è venduto singolarmente alle istituzioni accademiche (http://www.comp.lancs.ac.uk/ucrel/claws/purchase.html) oppure può essere usato attraverso un servizio svolto dai tecnici del UCREL. Infine per provare i risultati del pos-tagging si può inviare un testo e si ottiene una annotazione gratuita.
URL: http://www.comp.lancs.ac.uk/ucrel/claws/trial.html
[top]
OS: Windows (NT//98/2000/ME/XP)
Licenza: client per le consultazioni online gratuito
Cosmas II (Corpus Search, Management and Analysis System) è un programma costruito nel 1993 da Cyril Belica, sviluppato dall’Institut für Deutsche Sprache. Il software, scaricabile dal web, permette la gestione e l’interrogazione di una vasta gamma di corpora gratuitamente (per lo più in lingua tedesca). Il programma, che gira sotto Windows, può svolgere ricerche complesse su espressioni regolari e ricerche su annotazioni standard in SGML. Software e manuali di documentazione sono disponibili solo in lingua tedesca.
URL: http://www.ids-mannheim.de/cosmas2/
[top]
OS: Sun workstations, Linux PCs and Mac, demo per Windows
Licenza: gratuito
TreeTagger (TreeTagger - a language independent part-of-speech tagger) è un programma elaborato dal Institute for Computational Linguistics of the University of Stuttgart per operare etichettature per parti del discorso e lemmatizzazione su diverse lingue: tedesco, inglese, francese, italiano e greco. Putroppo il demo per Windows è limitato a 200 parole. Le altre versioni (Sun, Linux e Mac) sono gratuite. TreeTagger può anche essere consultato online al sito http://130.104.253.19/~pat/tagger/
URL: http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/DecisionTreeTagger.html
[top]
Connexor Machinese Phrase Tagger OS: GNU/Linux on IA32 (glibc 2.1+), Sun Solaris 2.6 and newer on SPARC, Microsoft Windows 98 or higher, SymbianOS
Licenza: a pagamento Connexor Machinese Phrase Tagger è un programma commerciale che svolge POS tagging associabile ad analisi sintattiche e semantiche. Lavora con molte lingue: inglese, spagnolo, tedesco, svedese, finlandese, italiano, olandese, danese e norvegese. E' possibile anche svolgere qualche tagging di prova al sito: http://www.connexor.com/demos/index.html. URL: http://www.connexor.com/m_overview.html
[top]
Ringrazio Fiammetta Carloni per alcune utili segnalazioni per questa pagina.
Per segnalare eventuali broken links, o siti di corpora significativi delle lingue trattate scrivete a isabella chiari.

