© Pavel Losevsky. Fotolia.com

INSEGNARE AI COMPUTER IL LINGUAGGIO UMANO

in
La ricerca interdisciplinare per sviluppare tecnologie del linguaggio e interazione uomo-macchina
intervista di Marinella Daidone a Giuseppe Riccardi

Quando nel 1968 uscì il film di Kubrick “2001: Odissea nello spazio”, che vede come protagonista il calcolatore HAL 9000, pochi avrebbero immaginato il ruolo svolto oggi dai computer e da altri strumenti tecnologici. La ricerca nel campo delle nuove tecnologie va avanti e richiede competenze sempre più ampie e differenziate.
Ne abbiamo parlato con Giuseppe Riccardi, professore associato di Informatica presso la Facoltà di Ingegneria dell’Università di Trento e membro del Dipartimento di Ingegneria e Scienza dell’informazione e del Centro interdipartimentale Mente/Cervello dell’ateneo. Il professor Riccardi ha fondato e dirige il gruppo di ricerca Adaptive Multimodal Information and Interfaces (AMI2) che sta sviluppando, tra l’altro, un progetto di ricerca nell’ambito di un accordo tra Università di Trento e Telecom Italia.

Professor Riccardi, il suo campo di ricerca, che va dalla tecnologia del linguaggio all’interazione uomo-macchina, mette insieme competenze e discipline molto diverse come l’ingegneria informatica e le scienze cognitive, ce ne può parlare?

Questo è un campo di ricerca scientifica che si configura sin dall’inizio come interdisciplinare e al quale contribuiscono competenze diverse che vanno dalla linguistica, all’informatica alla psicologia. Per quanto tutti gli scienziati siano a conoscenza del valore dell’approccio multidisciplinare in un ambito come questo, è estremamente difficile condurre ricerche che richiedano la collaborazione ed interazione di esperti in diverse discipline. Molto raramente si è riusciti a mettere insieme specialisti in ambiti che vanno dall’ ingegneria all’informatica, matematica, psicologia fino all’ antropologia. Importanti esempi di laboratori di ricerca industriale sono gli AT&T Bell Laboratories - dove sono stati inventati tra l’altro Unix, C++, il transistor ed i primi sistemi interattivi vocali - e i laboratori di ricerca IBM. Superato quel modello di ricerca ‘universale’, tali laboratori di ricerca hanno cambiato le loro strutture ed obiettivi, mentre sono nati altri centri di ricerca privati da Microsoft a GOOGLE. È un campo dove diventa rilevante la capacità dei ricercatori di costruire reti interdisciplinari di competenze; a Trento abbiamo le condizioni per fare questo tipo di ricerca sulla base di una rete di centri universitari pubblici e privati di rilevanza internazionale.

Alcune sue ricerche sono state divulgate anche sulla stampa nazionale, con scenari un po’ fantascientifici e citazioni dal film “2001 Odissea nello spazio”. Il futuro è già così vicino?

Si può dire che sin da quando nasce il calcolatore, a metà del secolo scorso, uno dei primi obiettivi è stato quello di esplorarne le capacità e le possibilità di interazione. Negli anni questa necessità si è sviluppata in varie direzioni. Una delle prime è stata la traduzione automatica che permettere a persone che parlano lingue diverse di essere assistite da computer in modo da poter comunicare. Uno dei primi robot interattivi (precursore dei chatbot moderni) è nato a fine anni ’60, quando presso i laboratori del MIT (Massachusetts Institute of Technology) si è creato un programma relativamente semplice: poche centinaia di righe che implementava una “creatura virtuale” chiamata Eliza che aveva il ruolo di psicoterapeuta virtuale. Erano gli stessi anni in cui veniva prodotto il film “2001: Odissea nello spazio”. Dagli albori di questo “illuminismo tecnologico” diffuso nelle capacità dei computer, abbiamo attraversato i primi cinquant’anni di importanti passi avanti scientifici ed innovazioni tecnologiche. Sono stati anni in cui i contributi provenienti da discipline quali l’ingegneria, la linguistica, la matematica applicata e più recentemente le scienze cognitive e le neuroscienze hanno dato risultati scientifici e tecnologici molto importanti. I ricercatori hanno cominciato la sperimentazione di agenti virtuali che possono interagire in forme e modalità “vicine” a quelle condivise normalmente tra le persone sia per applicazioni industriali ed educative sia per l’assistenza a persone con disabilità.

Come cambierà la nostra interazione con i nuovi strumenti tecnologici?

Uno strumento tecnologico come il “telefono” ha fatto la sua apparizione nelle case nel secolo scorso e da allora ha continuato ad evolvere sia nell’aspetto fisico che nelle potenzialità, da semplice interfaccia vocale a computer miniaturizzato con molteplici paradigmi e modalità comunicative. In questo inizio di millennio vi è stata una crescente proposta di strumenti tecnologici ad alto impatto industriale e sociale. Noi ricercatori dovremo creare le giuste premesse comunicative e i modelli per costituire un continuum di relazioni (virtuali ed umane) ed interazioni accettabili e sostenibili per tutti. Una tecnologia utile e sostenibile è tale perché non è ingombrante ma si rende “trasparente” e migliora la nostra qualità della vita.

Lo scorso anno ha vinto, insieme a Dilek Hakkani-Tür dell’International Computer Science Institute di Berkeley, un prestigioso riconoscimento, il IEEE Signal Processing Society Best Paper Award. A quali risultati scientifici si deve questo premio?

Per addestrare i computer a riconoscere in modo automatico segnali o parole, è necessario presentare ai computer degli esemplari di suoni e di parole. Ma quanti e quali esemplari devono essere presentati prima che il computer impari in maniera perfetta a riconoscere le categorie di base, diciamo le parole? L'approccio descritto nell’articolo è risultato innovativo perché coinvolge simultaneamente sia la macchina (computer) sia l'uomo nell'apprendimento di modelli matematici per il riconoscimento del parlato. Lo stesso approccio è poi stato applicato ad altri problemi nel campo dell’interazione uomo-macchina e all’elaborazione di modelli per il testo scritto. Nel nostro articolo, ci si chiede se sia possibile apprendere più velocemente di una generazione casuale degli esemplari. Oltre ad aver dimostrato come ciò sia possibile, abbiamo messo in evidenza che il processo di ‘apprendimento attivo’ fa sì che la macchina non solo elabori gli esemplari delle categorie, ma sia anche in grado di ‘rendersi conto’ di quando ha bisogno di supervisione o supporto nell'apprendimento di particolari categorie (parole o concetti) che siano difficili da capire.

Lei attualmente sta lavorando insieme al suo gruppo di ricerca ad una piattaforma tecnologica integrata di Business Intelligence, ci può spiegare di cosa si tratta?

Il termine Business Intelligence si riferisce alle tecniche di acquisizione ed utilizzo di conoscenza strategica a partire dalle informazioni generate dai processi interni ad una organizzazione o da processi esterni che possano influenzare le decisioni interne di tale organizzazione. Tali processi sono generati automaticamente dai sistemi informativi o dai processi comunicativi (project meetings, discussion groups, customer touch-points, etc.) delle varie unità di lavoro dell’organizzazione. Negli ultimi vent’anni la generazione di tale informazione a valle di questi processi è aumentata esponenzialmente così che si parla spesso di ’information overload’. Allo stesso tempo sono stati sviluppati strumenti tecnologici che permettono di rendere fruibile tale informazione in forma schematica, selettiva e produttiva per i decision makers delle strutture organizzative di un’azienda, di una pubblica amministrazione o di altre strutture. Queste tecnologie si basano sui più moderni sistemi di apprendimento automatico, delle tecnologie del linguaggio e delle interfacce comunicative.

Il progetto verrà sviluppato nell’ambito di una partnership con Telecom Italia. Cosa prevede questo accordo? Quali sono i risultati sperati?

L’accordo di programma con Telecom Italia prevede attività di ricerca sperimentale, innovazione industriale e di alta formazione nell’ambito delle tecnologie del linguaggio e delle interfacce comunicative. Uno dei progetti che abbiamo cominciato e che ha già ricevuto importanti risultati è quello dello sfruttamento e valorizzazione delle informazioni che provengono dai processi di ‘customer care’ installati nei vari touch-points (web, contact centers, etc.). In questo caso vengono raccolti flussi di dati eterogenei e rilevazioni statistiche sullo stato di ‘salute’ dei prodotti o servizi che Telecom Italia fornisce ai propri clienti interni ed esterni. L’obiettivo è quello di estrarre (semi) automaticamente informazioni utili al monitoraggio di tali servizi, alla segnalazione di anomalie, al miglioramento delle prestazioni e, non ultimo, all’evoluzione innovativa dei servizi stessi. Telecom Italia sponsorizza il nostro master di secondo livello in Tecnologie del Linguaggio ed Interfacce ed accog