Online il database messo a punto dalle università di Pisa e Siena, Cnr e Accademia della Crusca. Per la prima volta insieme lettere, diari, scritti di letterati e articoli apparsi sulla stampa nazionale dal 1914 al 1918. Uno strumento per conoscere non solo la storia di quegli anni, ma le parole usate per raccontarla da chi l’ha vissuta
I soldati? Muoiono, ma non uccidono. L’analisi sul linguaggio usato dai militari al fronte durante la prima guerra mondiale regala questa e altre sorprese. Nei diari e nelle lettere inviate ai familiari da chi stava in trincea manca quasi sempre l’elemento dell’esaltazione eroica, che invece abbonda negli articoli di giornale, nei testi di propaganda e nei comunicati ufficiali.
L’archivio vocidellagrandeguerra.it (finanziato dalla presidenza del Consiglio e realizzato dall’università di Pisa in collaborazione con l’istituto di Linguistica computazionale del Cnr, l’università di Siena e l’accademia della Crusca) è il primo e più grande database digitale che rende consultabili, ma soprattutto confrontabili, le varie fonti documentali che in quegli anni sono state protagoniste, da diversi punti di vista, del primo conflitto mondiale.
“Grazie all’uso di tecniche avanzate di linguistica computazionale, web semantico e visualizzazione dell’informazione è possibile interrogare l’archivio digitale in modo da far conoscere e apprezzare la polifonia delle voci dell’Italia in guerra – spiega Alessandro Lenci del dipartimento di Filologia, Letteratura e Linguistica dell’università di Pisa e responsabile scientifico del progetto – mettendo a confronto la voce ufficiale della propaganda, ma anche quella dei soldati e degli ufficiali, degli intellettuali e del popolo, del consenso, del dissenso, degli uomini e delle donne”.
Le fonti
Nell’archivio sono confluiti diari, lettere e testi messi a disposizione dalla biblioteca Nazionale centrale di Firenze, dal museo storico italiano della Guerra di Rovereto, del museo storico di Trento. Presenti anche atti parlamentari pubblici e trascrizioni delle sedute dei comitati segreti della Camera, articoli di giornalisti come Luigi Barzini, orazioni interventiste di Gabriele D’Annunzio accanto a lettere di soldati del Regno d’Italia di varie provenienze geografiche ed estrazioni sociali. A selezionare gli archivi e i testi più rappresentativi da inserire è stato lo storico Nicola Labanca (università di Siena), tra i più importanti studiosi di quel periodo storico.
A chi si rivolge
Un archivio di questo tipo, oltre che per gli storici punta a essere un riferimento anche per i linguisti, proprio per la sua capacità di mettere a confronto e rendere in forma grafica le profonde differenze nell’italiano utilizzato tra una fonte e l’altra. L’intento però è anche quello di interessare studenti e semplici curiosi. Per rendere il più possibile user-friendly la consultazione, l’estrazione e la visualizzazione dei dati anche a chi non è meno esperto nell’uso di questo tipo di archivi, spiega Lenci, è in cantiere la messa a punto di strumenti e guide all’uso.
Come funziona
Le ricerche possono essere affinate e filtrate per tipo di documento, per anno, genere testuale, autore, professione dell’autore. I risultati possono essere ristretti e confrontati incrociando e selezionando altre opzioni. Per esempio, si può vedere quanto spesso ricorra il termine “eroico” nei testi di intellettuali, media o propaganda o nella comunicazione ufficiale, quando invece i verbi e l’aggettivazione usata nelle lettere o nei diari dei soldati raccontavano un’altra realtà con il prevalere di termini quali “povero” o “morire”. Tra le funzionalità previste c’è anche la restituzione dei risultati di ricerca non solo in forma testuale e di diagramma ma anche in quella di wordcloud.
La piattaforma
L’importanza di un archivio come questo, spiega Lenci, non è solo nella quantità e qualità delle fonti messe a confronto, ma anche nell’aver richiesto la messa a punto di uno strumento nuovo che in futuro potrà essere messo a disposizione di altri tipi di indagine linguistica su diversi temi. In questo caso, il principale ostacolo da superare è stato quello di “piegare” gli strumenti di analisi computazionale del testo che usano tecniche di intelligenza artificiale addestrate sulla lingua standard contemporanea per adattarli all’italiano in uso cent’anni fa e alla grande variabilità dei testi scansionati ed esaminati, spesso pieni di errori ortografici, forme arcaiche, popolari e dialettali.
di Antonio Gentile