CERCARE IMMAGINI NEL WEB

in
Facilitare la ricerca di contenuti multimediali in Internet. Due progetti europei coordinati dal Dipartimento di Ingegneria e Scienza dell’Informazione
di Francesco De Natale e Nicola Conci

La ricerca nel Web di un’immagine, un video, o un brano musicale è molto diversa dal cercare un articolo di giornale o il testo di una canzone. Eppure la tecnologia dei motori di ricerca funziona pressoché allo stesso modo: l’utente interroga il sistema tramite un insieme di parole che ritiene significative (query) e riceve in risposta una serie di contenuti, ordinati in base alla corrispondenza con le etichette ad essi associate dagli autori del contenuto (tag).
È però evidente che descrivere un’immagine a parole è complicato e soprattutto soggettivo. Chi mi garantisce che la descrizione che ho in mente corrisponda con quella che anche l’autore ha scelto? L’immagine mentale che ognuno di noi forma nella propria mente in risposta ad un insieme di parole è unica e legata alla nostra personale esperienza del mondo.

Prendiamo l’esempio di una parola comune come “cane”. Il concetto è molto semplice, ma ciò che ognuno di noi immagina è del tutto personale. Se possiedo un cane penserò a lui, altrimenti a quello di qualche amico o parente, o a quello che mi ricorda un film, una fotografia, un cartone animato, o più in generale alla razza che ritengo più elegante, aggressiva o affettuosa. Non solo, ma in questo caso non sto nemmeno considerando i vari significati del termine (ad esempio il cane della pistola) e la pluralità di modi di esprimere lo stesso concetto in lingue o culture diverse. Tecnicamente questo insieme di fenomeni è quello che viene denominato “gap semantico”.
Non c’è quindi da stupirsi se gli utenti sono spesso insoddisfatti di quello che trovano in una ricerca e devono sfogliare molte pagine di risultati, raffinare la “query” o cambiarla totalmente prima di ottenere un risultato accettabile: il tassello mancante sta tra l’essenza semantica di quello che cerco e la “query” con cui lo descrivo.

Le moderne tecnologie di media retrieval tentano di risolvere questo problema con diversi approcci. L’idea principale è quella di introdurre nella ricerca un insieme di informazioni aggiuntive che precisino il “contenuto” e diano un “contesto” alla ricerca, in modo da ridurne l’ambiguità. Nell’esempio precedente, il contesto può ad esempio ridurre il dominio di ricerca al mondo animale (escludendo il cane della pistola), o alle immagini personali, o a una certa area geografica. Oppure il contenuto può essere meglio specificato facendo riferimento ad attributi (es. colore, razza, taglia) o fornendo un’immagine campione (es. “trova tutte le immagini di cani simili a quella data”).
L’associazione contenuto-contesto è in questo momento ritenuta la strada maestra per risolvere il gap semantico, ma rimane ancora un problema: “come” posso rappresentare tali informazioni? Si possono pensare varie soluzioni, che includono ad esempio l’uso di modelli matematici per rappresentare il contenuto delle immagini, l’estrazione automatica di concetti visivi, l’introduzione di modelli di conoscenza quali ontologie e tassonomie, l’utilizzo della conoscenza implicita contenuta nelle reti sociali.

Su queste tematiche si sono incontrati lo scorso aprile a Trento, presso il Polo scientifico e tecnologico Fabio Ferrari dell’ateneo, oltre cento ricercatori provenienti da ogni parte del mondo per la prima edizione della ACM International Conference on Multimedia Retrieval (ICMR2011). La scelta di Trento come sede della conferenza deriva da un lungo percorso di ricerca maturato in questi anni presso il laboratorio mmLab del Dipartimento di Ingegneria e Scienza dell’Informazione (DISI). Il DISI coordina attualmente due progetti di ricerca europei che esplorano nuove soluzioni in questa direzione (link dei siti nel box “vedi anche”) e che hanno contribuito a creare un vasto network di ricerca internazionale nel settore. Non a caso, come evento co-locato con ICMR, nella settimana precedente si è svolto sempre al Polo Ferrari il meeting di coordinamento nell’area Networked Media della DG-INFSO, con la partecipazione di rappresentanti dei principali progetti europei e della Commissione europea, operanti nel settore della multimedialità e delle reti di telecomunicazioni. L’appuntamento per la seconda edizione di ICMR è fissato ad Hong Kong per il 2012.