Migrazione di tecnologie e linguaggi. Un ciclo di seminari del CNR

locandina iliesiCon il seminario “Machine reading come metodo per collegare gli archivi testuali al Web Semantico” si è concluso il ciclo di seminari tecnico-formativi Migrazione di tecnologie e linguaggi. Teorie e pratiche per il trattamento ditesti nelle scienze umane, organizzato dall’Istituto per il Lessico Intellettuale Europeo e Storia delle Idee (ILIESI) del CNR.
I seminari, organizzati nell’ambito del Progetto Migrazioni (Responsabile Maria Eugenia Cadeddu), su progetto scientifico di Cristina Marras e Ada Russo, hanno presentato strumenti e linguaggi tecnici che migrano in ambito umanistico e si applicano al trattamento dei testi: dalla codifica (xml) e memorizzazione (basi di dati), passando per l’elaborazione (lemmatizzatori, web semantico, applicazioni lessicografiche), fino alla presentazione e pubblicazione (latex, ojs, edizioni digitali). Il carattere formativo degli incontri ha inteso valorizzare lo scambio di saperi, le competenze e le esperienze tecniche tra discipline che affrontano problemi comuni. Questa serie, nata con l’intento di valorizzare e condividere l’esperienza di studio dell’ILIESI sulle tecnologie digitali per il trattamento dei testi, rappresenta la continuazione ideale di un precedente ciclo di Seminari formativi avviato nel 2013, pensato per mettere in comune le linee di ricerca condotte all’ILIESI al fine di formare i giovani collaboratori.
Il primo seminario del ciclo, Teorie e pratiche nell’uso dell’XML/TEI per la codifica dei testi (13 marzo 2014), tenuto da Ada Russo (ILIESI-CNR), è stato dedicato ad illustrare il linguaggio XML/TEI, con particolare riguardo al suo impiego per la codifica di testi a stampa in edizioni d’epoca, in vista di elaborazioni lessicografiche e per la costituzione di corpora testuali.
Argomento del secondo seminario è stato Latex: l’arte di formattare testi (9 aprile 2014). Roberto Vitali (Sapienza Università di Roma) ha illustrato le potenzialità di LaTeX e come il suo utilizzo possa arricchire, sia per la qualità del prodotto finale, che per la maggior produttività, anche la composizione di testi legati alle scienze umanistiche.
Fabrizio Pecoraro (IRPPS-CNR) ha affrontato il tema delle Piattaforme per le pubblicazioni online(19 maggio 2014) illustrando le potenzialità degli strumenti forniti dalle tecnologie dell’informazione con particolare riferimento al software open source Open Journal Systems (OJS) di cui sono state descritte le principali funzionalità.
Muruca: strumenti e applicazioni per la gestione di biblioteche digitali semantiche (19 giugno 2014) è stato illustrato da Alessio Piccioli (NET7). Il seminario ha introdotto all’uso, alla modulazione e alla gestione di Muruca, un framework open source, sviluppato per la realizzazione di biblioteche digitali semantiche, illustrando i principi alla base della costruzione di una biblioteca digitale e il significato del termine “semantico”.
Felice Dell’Orletta (ILC-CNR) ha descritto le potenzialità de La piattaforma T2K: dal testo alla conoscenza (16 ottobre 2014). T2K è una piattaforma web finalizzata all’acquisizione di informazione semantico-lessicale da corpora di dominio, in grado di analizzare il contenuto dei documenti, estrarre i termini più significativi, indicizzare il corpus di partenza e ricostruire una mappa della conoscenza contenuta nella collezione documentale.
La lessicografia dei testi di cultura. Un esempio di software dedicato (13 novembre 2014) è il tema trattato da Marco Veneziani (ILIESI-CNR), che ha parlato dell’apporto delle tecnologie informatiche nello studio dei testi di cultura: dai semplici programmi di scrittura alle applicazioni web più complesse e sofisticate, fino alla possibilità di un esteso ricorso agli spogli lessicografici e lessicometrici, presentando alcune effettive realizzazioni.
Nell’ultimo dei seminari di questo ciclo è stato trattato il tema del machine reading (11 dicembre 2014). Aldo Gangemi, dell’Istituto di Scienze e Tecnologie della Cognizione (ISTC-CNR), ha posto l’accento sul fatto che recentemente, la ricerca sul Web Semantico e l’ingegneria della conoscenza ha cominciato a ibridarsi con gli strumenti e le risorse sviluppate dalla comunità di trattamento delle lingue naturali, sviluppando nuovi strumenti che aggiungono al paradigma del machine reading anche la capacità di estrarre l’informazione dal testo, formalizzandola ed eseguendo inferenze automatiche.
Per contribuire allo scambio di saperi e esperienze, è stata resa pubblica una sezione del sito web dell’ILIESI, http://www.iliesi.cnr.it/iniziative/seminari_formativi.html dove sono stati raccolti tutti i materiali relativi ai seminari; abstract, profili dei relatori, slide delle presentazioni, indicazioni bibliografiche e di strumenti specifici a cui si è fatto riferimento durante i seminari. I materiali sono disponibili gratuitamente per l’uso e il riuso delle informazioni e della documentazione da parte di studenti, docenti e chiunque altro interessato.

 


Ada Russo – Istituto per il Lessico Intellettuale Europeo e Storia delle Idee (ILIESI-CNR) – ada.russo(at)cnr.it

Annarita LiburdiAnnarita Liburdi – Istituto per il Lessico Intellettuale Europeo e Storia delle Idee (ILIESI-CNR) – annarita.liburdi(at)cnr.it