Abbiamo già visto altrove come il  linguaggio (e lo studio del linguaggio) costituisca un elemento altamente significativo per l’intelligence ed in particolare per l’intelligence delle fonti aperte. Abbiamo anche visto come il contesto tipico all’interno del quale l’OSINT opera è quello documentale o – ancor meglio – quello documentale-testuale.

Va da sé che un linguaggio non è tale se non genera produzioni che possono essere … lette (e magari anche comprese). In altre parole – e mi perdoneranno gli esperti della materia per l’ingenua approssimazione – un linguaggio è tale quando è composto da un insieme finito di simboli che vengono combinati sulla base di regole grammaticali (sintassi) aventi un significato valido (semantica) nell’ambito di una qualche attività di comunicazione (pragmatica). Tali struttura in ultima istanza tende al restringimento della possibilità di produrre, a partire dai simboli a disposizione, costruzioni eccessivamente ambigue, facilitando in tal modo la rappresentazione dei concetti e pertanto la lettura (appunto) del messaggio che li rappresenta.

Ebbene anche nell’ambito delle tecnologie per la lettura, il nostro Paese ha le sue carte da giocare e lo fa attraverso Cross Library Services un progetto finalizzato alla massimizzazione della fruibilità del patrimonio culturale digitale. La questione del patrimonio culturale digitale (che possiamo per semplicità ridurre al concetto di base di conoscenze nazionali) e della sua rilevanza strategica per il sistema paese non è cosa recente, ma purtroppo fin’ora non si è mai sviluppato il dibattito che la problematica meriterebbe.

Sistemi di comprensione automatica del testo al lavoro su “I Promessi Sposi”.

E’ appena il caso di far notare che il “motore” di queste tecnologie non è così diverso (probabilmente non lo è per niente) da quelli utilizzati per le applicazioni di text mining orientate all’intelligence: cambia solo ampiezza e tipologia del corpus di informazioni che vengono processate, “date in pasto” al sistema.

Un corpus che nel caso specifico – inglobando ipoteticamente i patrimoni culturali digitali di uno o più paesi – va avvicinandosi sempre di più al concetto di Infosfera che tanto ci piace incardinare all’interno della teoria generale dell’intelligence delle fonti aperte come uno dei pilastri sui quali si fonda la epistemologia dell’OSINT.

A questo punto mi sembra di poter dire che la cosa si fa molto interessante… ;)