We stand with Ukraine

Evoluzione semantica nella gestione dei documenti: l’innovativo sistema di classificazione della Camera dei Deputati

15 Novembre 2010

16 nov 2010

Expert System annuncia oggi che in occasione dell’EuroVoc Conference (Luxembourg, 18-19 novembre) la Camera dei Deputati presenterà la soluzione adottata per la classificazione degli atti parlamentari grazie all’impiego della tecnologia semantica di Expert System.

Il software semantico Cogito è stato introdotto nel 2008 nelle attività di classificazione della documentazione parlamentare, e in particolare degli atti di sindacato ispettivo (cioè interrogazioni, interpellanze e atti di indirizzo formulati dai deputati). La capacità della semantica di capire il significato delle parole consente infatti di analizzare ogni documento e di associarlo automaticamente alla categoria più rilevante prevista dallo standard Eurovoc, il thesaurus multilingue e pluridisciplinare utilizzato dall’Unione europea (composto da oltre 6645 categorie).

Il sistema di classificazione semantica è stato realizzato per:
– ridurre il tempo necessario alla classificazione dei documenti;
– assicurare una maggiore efficacia dell‘attività di classificazione, limitando notevolmente la dipendenza dalle normali variazioni di attenzione tipiche della classificazione manuale.

Semplificando, il funzionamento del processo di classificazione prevede le seguenti fasi:
– un testo in ingresso da classificare;
– processo di disambiguazione: analisi grammaticale, analisi logica e associazione dei concetti agli elementi del testo (ovvero analisi di tutti i possibili significati di un testo);
– l’applicazione delle regole linguistiche al testo, per selezionare la categoria più pertinente da associare al testo;
– risultato della classificazione: al documento vengono associate una o più categorie che costituiscono l’argomento principale e gli argomenti secondari del testo in ingresso.

L’applicazione per la classificazione sviluppata in collaborazione con Expert System – che ha realizzato soluzioni simili impiegate soprattutto da importanti realtà editoriali (AGI, Ansa, RCS, Il Sole 24 Ore ecc.) – fornisce quindi un valido supporto per gli addetti parlamentari nelle attività di catalogazione degli atti, in vista anche di future implementazioni ad altre tipologie di contenuti istituzionali della Camera dei Deputati.

 

La soluzione adottata dalla Camera dei Deputati sarà presentata durante l’intervento “Eurovoc and parliamentary documents: a semi-automatic classification experience at the italian Camera dei Deputati” in programma il 19 novembre nell’ambito dell’EuroVoc Conference, Mind the Lexical Gap, il principale evento europeo dedicato al thesaurus EuroVoc e ad altri strumenti di indicizzazione in grado di semplificare l’accesso e l’interoperabilità tra contenuti multilingue.

 

“L’ampio e innovativo progetto che da tempo portiamo avanti con la Camera dei Deputati dimostra l’efficacia della tecnologia semantica nel risolvere problemi quotidiani di gestione di grandi quantità di documenti, di qualunque tematica trattino, anche articolata e complessa come quelle che riguardano gli atti parlamentari” dichiara Maurizio Mencarini, Sales Director Intelligence Division di Expert System.

 

Il programma dell’Eurovoc Conference