Accesso all'informazione giuridica e nuove tecnologie

AutoreMaria Angela Biasiotti
CaricaRicercatore presso l'ITTIG del CNR.
Pagine153-166

Page 153

@1. Conoscenza Dell'informazione Giuridica In Internet Nell'era Del Semantic Web

In questi anni abbiamo assistito ad una vertiginosa messa in linea di informazioni di vario tipo quasi per ogni settore dello scibile umano: turismo, attualità, politica, cultura, sport e via dicendo fino al settore dell'informazione pubblica coinvolto nel processo di digitalizzazione soprattutto grazie alla spinta iniziale delle politiche europee relative alla società dell'informazione e della conoscenza.

L'esigenza di diffusione e conoscenza dei dati pubblici, oltre ad essere infatti un effetto delle politiche di e-government, è da considerarsi altresì uno dei dictat fondamentali per migliorare il rapporto tra cittadini e poteri pubblici in vista di una maggiore partecipazione dei primi nelle attività del vivere comune esercitate dai secondi. Il cittadino digitale ha infatti bisogno, nello svolgimento della sua dimensione sia pubblica che privata, di avere a disposizione quelle risorse che gli consentano di agire in modo consapevole. L'informazione pubblica diventa così la materia prima più importante nelle società democratiche, la linfa vitale della democrazia, e con essa la gran parte dei dati pubblici, rappresentati essenzialmente, anche se non esclusivamente, dall'informazione prodotta dai pubblici poteri sia a livello statale (Parlamento, Governo, magistratura) che a livello europeo (Unione europea).

Reperire o meno la risorsa giuridica può voler dire per il professionista vincere o perdere una causa e per un cittadino godere di un diritto o contravvenire ad obblighi. Queste possibilità hanno subito un'espansione esponenziale con la messa in rete di tutta una serie di informazioni giuridiche ora Page 154 liberamente accessibili, la cui consultazione in precedenza era riservata a pochi (fattore economico e fattore legato all'interesse professionale). L'utente non è più solo il professionista esperto della materia ma è il cittadi no comune che cerca informazione giuridica on line benché non abbia tanta conoscenza giuridica da poter impiegare nella formulazione della query.

@2. Problematiche Della Ricerca Dell'informazione Giuridica In Internet E Limiti Delle Attuali Strategie Di Ricerca Nel Web

Esiste, di fatto, un sostanziale scollamento tra l'informazione esistente nel web e quella che l'utente riesce, di volta in volta, a reperire. Pur fornendoci un servizio indispensabile, i motori di ricerca soffrono infatti di evidenti limiti che si manifestano palesemente andando ad analizzare i risultati restituiti alle nostre ricerche. Essi si basano, comunque, su un solo dato, la frequenza di parole-chiave nei documenti, e si differenziano tra loro soprattutto nell'efficienza dell'algoritmo di spider e dell'algoritmo di ordinamento dei documenti ritenuti rilevanti per l'utente. Sono, dunque, motori puramente sintattici, in cui la semantica non entra a fare parte, né nella stringa di ricerca né nell'indicizzazione del documento. Tali motori di ricerca sono perfettamente adeguati in alcuni casi, quando l'utente vuole cercare esattamente le parole (o la frase completa) che ha inserito nel campo di ricerca, ma non sono pienamente soddisfacenti quando l'utente indica un argomento, oppure un concetto, e non una parola chiave.

In generale, possiamo dire che il limite comune è la mancanza diffusa di semantica. Proprio per questo appare utile pensare ed ipotizzare l'applicazione di soluzioni, che associano a un testo generico dei pesi relativi agli argomenti trattati e che sappiano risalire dalla stringa di ricerca inserita dall'utente al concetto riguardo al quale egli vuole avere informazioni. Un tale meccanismo potrebbe offrire all'utente diverse possibilità avanzate, ottenute attraverso semplici relazioni tra i diversi concetti: indagare in concetti più particolari o precisi di quelli direttamente cercati, o viceversa risalire verso il più generale, approfondire argomenti correlati, e così via. Come vedremo, il rovescio della medaglia è che la ricerca ideale potrà avvenire solamente su un dominio di conoscenza ristretto.

La ricerca dell'informazione giuridica incontra quindi dei limiti che sono propri dei sistemi dell'information retrieval (eccesso di informazione reperita, utilizzo di keywords, ambiguità del linguaggio naturale) e altri limiti connessi direttamente alla natura specifica del dominio giuridico. Per esigenze di brevitas di questo contributo verranno analizzati solamente alcuni di questi limiti che sono particolarmente rilevanti per la ricerca dell'informazione giuridica. Page 155

@@2.1. Limiti connessi all'utilizzo di keywords

Una ricerca testuale per parole contenute nei documenti e non per concetti implica che un utente per reperire l'informazione debba indicare con precisione nella sua query la parola esatta che ritiene possa essere contenuta nel documento, con il risultato che qualora la scelta terminologica operata dall'utente (che dovrà stare particolarmente attento a non utilizzare parole troppo generiche né troppo specifiche) non sia corrispondente a quella operata ad esempio del legislatore o dal giudice, egli non troverà l'informazione che sta cercando ma che tuttavia esiste. Se invece egli avrà indicato la parola giusta si troverà sicuramente di fronte ad un significativo numero di documenti tutti contenenti quella parola con domini diversi e dovrà fare egli stesso la selezione per raggiungere l'informazione che sta cercando. La maggior parte dei documenti attualmente disponibili sul web è stata pensata per essere letta e compresa da un utente e non per essere compresa da una macchina. I motori di ricerca così non sono in grado di comprendere il significato di un documento e non possono perciò andare oltre la ricerca per keywords.

L'interfaccia dei sistemi di reperimento dell'informazione basata sul con fronto di sequenze di caratteri non è in grado di identificare i concetti rilevanti che dovrebbero comparire nelle risorse reperite. I termini che l'utente specifica nella sua query sono utilizzati per effettuare la ricerca nel full-text come descrittori sintattici del contenuto dei documenti. Questo in quanto la ricerca dei documenti è prevalentemente basata sulle tecniche tradizionali dell'information retrieval un modello funzionale che individua la corrispondenza tra l'insieme delle domande e l'insieme dei documenti, mediante un linguaggio intermedio di rappresentazione, detto linguaggio di indicizzazione o linguaggio di classificazione.

Possiamo dire quindi che i limiti dei sistemi tradizionali di information retrieval sono essenzialmente quelli connessi all'uso di parole chiave. Una volta che le pagine sono state scaricate e il file indice costruito, ciascuna interrogazione viene elaborata recuperando soltanto le pagine che contengono esattamente le parole specificate nell'interrogazione. Questa è una limitazione molto forte, alla luce della ricchezza e dell'ambiguità del linguaggio naturale. In particolare, se una pagina contiene lo stesso concetto espresso con parole differenti essa non viene recuperata.

L'utente alle prese col problema di scegliere le parole giuste per descrive re le pagine che non conosce fa venire in mente la situazione di quel proverbio cinese che dice: "Sei sai quello che cerchi perché lo cerchi? E se non lo sai come speri di trovarlo?". Page 156

Indipendentemente dalla possibilità di migliorare la formulazione delle interrogazioni risolvendo i problemi di polisemia e sinonimia, rimane il fatto che un meccanismo basato su parole chiave non riesce a cogliere la semantica di pagine e interrogazioni, e può fraintendere la loro apparente somiglianza. Per esempio come è stato fatto notare in questo senso1 la frase "Giovanni ama Maria" non sarebbe discriminata con l'utilizzo delle attuali strategie di ricerca dalla frase "Giovanni non ama Maria", in quanto ciò richiederebbe la capacità di identificare concetti e relazioni (chi ama e chi è amato).

@@2.2. Limiti connessi all'ambiguità del linguaggio naturale

Il linguaggio di indicizzazione e quindi di ricerca tende generalmente ad identificarsi con il linguaggio ordinario. Ciò comporta che la ricerca possa subire i guasti dovuti a due caratteristiche del linguaggio naturale, la ambiguità causata dalla polisemia e la varietà prodotta alla sinonimia2. In queste condizioni, a causa dei problemi di sinonimia (parole differenti con lo stesso significato) e...

Per continuare a leggere

RICHIEDI UNA PROVA

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT