Strumenti informatici per l'analisi e il controllo linguistico dei testi legislativi ed amministrativi

Autore:Francesco Romano
Pagine:103-134
RIEPILOGO

1. Premessa. 2. Il metodo. 2.1. La definizione dei modelli: un "approccio normativistico". 2.2. Modelli "ben formati" e "mal formati". 2.3. Il parser per l'estrazione delle informazioni dai testi normativi. 2.4. Compilazione della grammatica. 2.5. Scelta e analisi automatica del campione. 3. Applicazioni. 3.1. Reperimento e comunicazione del testo normativo. 3.2. Consolidamento e coordinamento... (visualizza il riepilogo completo)

 
ESTRATTO GRATUITO

Page 103

@1. Premessa

Agli inizi degli anni '90 un gruppo di ricercatori del CNR iniziò a occuparsi di modellare il ragionamento e le procedure relative alla produzione legislativa1.

Nacque così una nuova disciplina, la legimatica, che sperimentando le discipline informatiche a supporto della tecnica legislativa si è proposta come materia in ter disciplinare "tra teoria generale del diritto, informatica tradizionale, intelligenza artificiale, linguistica e scienza cognitiva"2.

Page 104

Già allora appariva chiaro che limitarsi ad usare l'informatica a valle del processo legislativo, solo per facilitare l'accesso alla norma, rischiava di assoggettare l'attività legislativa ad ulteriori vincoli (quelli necessari a consentire l'utilizzo di strumenti informatici) mentre con la legimatica, l'informatica viene proposta anche in fase di redazione legislativa ad esempio al fine di creare modelli per la verifica ex ante dell'applicabilità finanziaria ed amministrativa delle leggi e del loro impatto nel tessuto amministrativo, sociale ed economico, esigenza oggi molto dibattuta ed avvertita in particolare dalle assemblee legislative centrali e regionali che stanno attrezzando i propri uffici per l'analisi di impatto della regolazione (AIR)3.

Ancora oggi presso l'ITTIG si conducono, tra le altre, ricerche finalizzate alla definizione, descrizione e formalizzazione di modelli di strutture di testi normativi in base a regole linguistiche e giuridiche per il riconoscimento automatico e l'analisi del linguaggio dei testi normativi stessi.

Questo tipo di ricerca4, utile per quelle istituzioni che hanno l'esigenza di convenire le loro informazioni giuridiche, specie le leggi, in un formato standard per facilitarne la ricerca e la comunicazione nel WEB5, vede molte altre possibilità applicative sia per il consolidamento e coordinamento dei testi normativi sia per la generazione, valutazione ePage 105 controllo degli stessi testi. Lo standard tecnico necessario per tale conversione e per le applicazioni conseguenti è stato individuato nel linguaggio di marcatura XML6.

Il linguaggio XML (eXtensible Markup Language) consente infatti il trasferimento di conoscenza anche semantica al computer, attraverso l'introduzione nei testi di codici o marcatori, che risultano leggibili e comprensibili anche dalla macchina per mezzo di una apposita grammatica che associa ad ogni marcatore un determinato significato.

La definizione di questo insieme di regole richiede la costruzione di un modello di riferimento semantico-strutturale o DTD (Document Type Definition) della classe di documenti che si vuol marcare.

Tuttavia la marcatura XML è attività che, se fatta manualmente, risulta lunga e dispendiosa, per di più l'ambiguità e l'indeterminatezza del linguaggio naturale fa si che i singoli documenti si distanzino spesso dal modello definito, aggravando ulteriormente il lavoro di marcatura.

Questa peculiarità del linguaggio espone il metodo di marcatura ad altri due pericoli:

  1. non riuscire a cogliere tale ambiguità ed indeterminatezza,

  2. piegare il significato testuale all'esigenza di utilizzo di tale marcatura.

    Per tentare di ovviare a questi problemi si può agire in una duplice direzione:

    - sviluppare strumenti di Natural Language Processing (NLP) che consentano il riconoscimento del testo e la sua marcatura automatica anche se le strutture testuali si distanziano dal modello. Tale marcatura infatti, difficilmente ottenibile dal redattore dei testi, in quanto estranea ai compiti e alle finalità della sua attività, se attuata da altri operatori con interventi successivi provoca (ed in alcuni casi ha già provocato) una dilatazione, spesso insostenibile, nei tempi e costi;

    Page 106

    - stabilire degli standard linguistico documentali (regole di scrittura dei documenti) che rendano più omogenee, coerenti e puntuali le strutture dei documenti e quindi consentano alla macchina di riconoscere più agevolmente le strutture standardizzate. Per il linguaggio normativo esistono ad esempio standard legistici7, che essendo applicati e rispettati dalla fine degli anni ottanta8, oltre a rendere la legge più chiara e quindi comunicabile9, facilitano l'adesione allo standard tecnico proposto con il linguaggio XML, da parte degli enti produttori di norme.

    Tali standard legistici hanno conosciuto una diffusione ed applicazione crescente che però non sempre è stata rigorosa ed uniforme10.

    @2. Il metodo

    Nei paragrafi che seguono sarà illustrato il percorso metodologico adottato all'interno del progetto "Metodologie legimatiche per l'implementazione di una grammatica normativa" per un parsing efficiente e quindi per il riconoscimento automatico di strutture dei testi normativi e per la successiva marcatura e conversione di tali testi in formato XML.

    Le fasi di questo metodo sono le seguenti:

    Page 107

  3. individuazione e descrizione di modelli, in base a regole giuridiche;

  4. individuazione e descrizione di strutture testuali che esprimono i modelli giuridici definiti;

  5. scelta dello strumento tecnico per l'implementazione del parser e l'estrazione delle informazioni;

  6. compilazione della grammatica secondo la sintassi del parser prescelto;

  7. scelta e analisi automatica di un campione di testi normativi.

    @@2.1. La definizione dei modelli: un "approccio normativistico"

    L'applicazione di un dispositivo di parsing richiede la definizione di modelli, cioè di un insieme di regole per l'individuazione nei testi, di strutture linguistiche portatrici dell'informazione che si vuole estrarre.

    In questo senso si può parlare di compilazione di una grammatica specifica del dominio o del corpus di testi da analizzare, in questo caso i testi legislativi.

    Questa grammatica è composta da un insieme di modelli di strutture linguistiche.

    A loro volta i modelli comprendono una o più regole che vengono successivamente compilate secondo la sintassi del parser per l'analisi del testo della legge e l'estrazione delle informazioni.

    La linguistica computazionale cerca di ricostruire tali regole e modelli a posteriori, indicando come metodo più efficace per la costruzione della grammatica l'estrazione dell'insieme di regole e modelli da un certo numero di esempi delle strutture linguistiche del dominio da trattare11.

    Tale metodo però, applicato ai testi normativi trascura la specificità della natura e della funzione di questi testi.

    Sappiamo infatti che il testo normativo ha, per definizione, funzione prescrittiva, in altre parole incide sui comportamenti e lo status del destinatario, che non può sottrarsi a tale funzione.

    Page 108

    In virtù di questa, si richiede (in base allo stesso principio di rappre-sentenza democratica, che legittima e al tempo stesso vincola colui che produce gli atti normativi, cioè il legislatore) che il testo normativo risponda ad un insieme di regole che sovrastanno e contemporaneamente affiancano, integrano, a volte modificano le regole che compongono la lingua naturale (nel nostro caso l'italiano).

    Tali regole si possono definire come regole giuridiche.

    Come immaginabile la categoria è ampia e variegata e comprende al suo interno regole con una forza prescrittiva che varia per l'influsso di vari fattori come, ad esempio, la fonte di emanazione, i destinatari, le sanzioni che le corredano.

    Circa la validità e l'efficacia dei modelli costruiti in base a tali regole è opportuno aggiungere alcune considerazioni.

    L'efficienza dei modelli dipende, in gran parte da tre caratteristiche che gli stessi devono possedere: flessibilità, precisione e autorevolezza.

    La flessibilità è necessaria al modello, per adeguarsi alla molteplicità delle caratteristiche strutturali, funzionali e tematiche dei testi normativi, che utilizzano quel veicolo estremamente mutevole e imprevedibile che è il linguaggio e sono al servizio di un legislatore e di un interprete che hanno bisogno di elasticità e discrezionalità per la formazione e l'applicazione della norma.

    La precisione nella definizione del modello, è una caratteristica connessa alla presenza di regole giuridiche, in molti casi dettagliate e puntuali e alla prescrittività del testo normativo.

    Va da sé che conciliare flessibilità e precisione costituisce un punto cruciale nella costruzione dei modelli stessi.

    Infine il modello, deve essere dotato di una certa autorevolezza in modo che sia condiviso e ritenuto valido da tutti gli utenti del sistema.

    È chiaro che tale autorevolezza è maggiormente garantita se il modello è derivato da vere e proprie regole normative, secondo la loro gerarchia, mentre sarà garantita in misura minore da quelle regole che solo il redattore è tenuto a seguire12.

    Page 109

    Per questo motivo abbiamo chiamato "normativistici" i modelli più autorevoli e "interpretativi" quelli a bassa autorevolezza.

    Per la descrizione di un testo normativo, ai fini della comunicazione erga omnes, non si può che far riferimento ad un modello "normativistico" e potrebbe risultare pericoloso e fuorviante l'uso di uno "interpretativo".

    Si pensi ad esempio alle norme costituzionali che impongono che la delega legislativa debba contenere un termine entro il quale il Governo è tenuto ad emanare il decreto legislativo delegato.

    Un termine può essere contenuto anche in una delega amministrativa, ma se tale termine non è previsto in una legge o in altro provvedimento di pari autorevolezza, se ne può discutere ed interpretare la perentorietà13.

    Si vuole inoltre precisare che si è cercato di definire modelli che possono riferirsi all'intero ordinamento, a singoli atti o disposizioni, ad elementi all'interno delle varie disposizioni, in ogni caso modelli che sono costituiti da elementi ricavabili dal testo della legge e dunque escludono la formalizzazione di elementi extra testuali che richiederebbero una interpretazione del testo in base a stati di fatto, ove con questi ultimi si intendono presupposti, premesse, implicazioni e conseguenze dell'elemento modellizzato.

    Anche in tal senso si può...

Per continuare a leggere

RICHIEDI UNA PROVA