L'approccio sistemistico nell'analisi e sintesi di testi in linguaggio naturale, con particolare riguardo a testi giuridici

AutoreG. Degli Antoni/D. Marini/B. Zonta
CaricaG. Degli Anioni e D. Marini svolgono la loro attività presso l'Istituto di cibernetica dell'Università degli studi di Milano. B. Zonta svolge attività di ricerca presso il Centro di cibernetica e di attività linguistiche del CNR, Milano
Pagine17-37

Page 17

@Introduzione

L'estensione delle applicazioni degli elaboratori è resa possibile anche dall'impiego di sottoinsiemi di linguaggi naturali nella comunicazione uomo-macchina.

D'altra parte, la rappresentazione di informazioni negli archivi degli elaboratori richiede un notevole livello di formalizzazione onde poterli impiegare in applicazioni dotate di un livello di efficienza accettabile.

Ne segue che adozione del linguaggio naturale nella comunicazione uomo-macchina, per quanto oggetto di ricerca, è ben al di là delle attuali applicazioni.

L'adozione di linguaggi artificiali particolarmente semplici è certamente la soluzione del problema della comunicazione uomo-macchina in molti casi.

Tuttavia, l'interesse alla adozione del linguaggio naturale non può non essere fra gli obbiettivi anche di approcci che rientrino nelle possibilità tecnologiche attuali.

In questo ordine di idee la presente nota intende delineare un atteggiamento generale nella adozione di linguaggi naturali nella comunicazione-uomo-macchina a partire da testi scritti.

L'atteggiamento proposto è volto a rendere più semplice l'attuazione delle applicazioni orientate alla comunicazione uomo-macchina in settori limitati,Page 18 con una forte preferenza per la stesura di testi in linguaggi naturali eia parte precedimenti meccanizzabili.

Dopo aver indicato le basi generali di una attitudine (sistemistica) volta all'analisi di testi in linguaggi naturali, si discute la possibilità di costruire (sintesi) testi in linguaggio naturale a partire dalla-rappresentazione formale di opportuni testi.

Si mostra come la possibilità della sintesi di testi consenta di estendere le applicazioni, in quanto rende disponibili testi in ' linguaggio naturale a partire da informazioni formalizzate, avviando con ciò all'utilizzazione immediata di dati contenuti in archivi meccanizzati, dati che.vengono ad esempio raccolti automaticamente durante la vita di un sistema informativo.

Dopo una discussione su alcune applicazioni significative delle proposte avanzate, si analizzano le caratteristiche di un linguaggio " artificiale (reti di Petri) che permette la descrizione formale di informazioni contenute in testi di linguaggio artificiale e la preparazione di testi in linguaggio naturale a partire da ipotesi formali.

L'adozione di competenza sistemistica nella analisi e sintesi di testi rende più evolutiva la competenza sul tema, poiché lega gli sviluppi sullo studio dei testi a nuove competenze sullo studio di sistemi, permettendo altresì di utilizzare competenze a molti livelli di astrazione, proprio come tipicamente avviene nello studio dei sistemi.

@Analisi e sintesi di testi

Intenderemo qui con «testo» una sequenza di simboli che possa essere considerata leggibile e significante in un linguaggio naturale, ovvero in una lingua storica.

1/analisi di un testo è una attività rivolta a costruire un nuovo testo in un linguaggio artificiale formale a partire dal testo assegnato.

La sintesi, viceversa, è l'attività volta' a costruire un testo in un linguaggio naturale a partire da un testo in linguaggio artificiale.

L'analisi e la sintesi si dicono meccanizzate se vengono effettuate con procedimenti meccanici. Poiché, tuttavia, sarà impossibile disporre di procedimenti completamente meccanici per l'effettuazione di analisi (e sintesi), sarà preferibile introdurre la nozione di «analisi e sintesi dei testi assistita da elaboratore». La nozione verrà impiegata in tutti quei casi in cui solo una parte dei procedimenti analisi e sintesi potrà essere meccanizzata (ATAE/-STAE).

La tecnologia rende disponibili numerosi strumenti di ausilio alla manipolazione di testi. Tali strumenti facilitano non solo l'edizione di testi, la loro archiviazione o diffusione in canali informativi -(«word processing»), maPage 19 anche l'estrazione di un minimo di informazioni, la loro archiviazione, la costruzione e la modifica di testi («text processing»).

@Analisi sistemistica dei testi

L'analisi dei testi può venire effettuata per molte ragioni. Quella che qui interessa sottolineare è la preparazione di un testo in un linguaggio formale artificiale da sottoporre ad elaborazione automatica.

Gli obbiettivi di quest'ultima possono essere molteplici: la traduzione del testo originale in un'altra lingua, il riassunto del testo originale, l'esecuzione di indicazioni contenute nel testo, la classificazione, ecc. E proprio -dagli obbiettivi dipenderà la scelta del linguaggio artificiale.

Ad esempio, se la traduzione è Pobbiettivo, il linguaggio formale dovrà permettere di rappresentare direttamente, o fornire l'accesso a, tutti quegli elementi che consentono la traduzione automatica in una data lingua.

Se Fobbiettivo è la classificazione del testo, allora il linguaggio artificiale sarà una «formula» che descrive aspetti rilevanti del testo originale.

Dalla scelta del"linguaggio artificiale dipende non solo la difficoltà del procedimento di analisi, ma anche eventualmente la «felicità» (possibilità e semplicità) con cui vengono rappresentati concetti di interesse.

Noi introdurremo il termine «analisi sistemistica di un testo» in tutti quei casi in cui il procedimento di analisi conduce a un testo (formale) espresso nel linguaggio artificiale, a cui è associata una interpretazione in termini di sistemi (descrizione di sistemi, comportamento di sistemi, proprietà, relazione fra sistemi e loro comportamento, ecc).

L'atteggiamento sistemistico è alquanto naturale in molte situazioni in cui Fobbiettivo dell'estrazione dell'informazione ha scopi modellistici, quale ad esempio la progettazione in ingegneria. Ma anche nelle discipline cognitive tale attitudine è imposta dalla necessità di descrivere in termini accurati e finiti le ipotesi e i risultati delle ricerche;

Limitazioni pratiche a ciò che può essere rappresentato in una notazione di tipo sistemistico non sono facilmente individuabili. Ciò non implica che sia semplice attuare l'analisi sistemistica di testi arbitrari. Anzi, quando la tradizione non abbia già impostato una qualche formalizzazione, l'analisi sistemistica risulterà in generale problematica se non del tutto irrealizzabile.

Così, ad esempio, la descrizione formale della struttura di un sistema di elaborazione delle informazioni a partire da un testo che ne da una descrizione in linguaggio naturale, per quanto possa essere di realizzazione costosa, è certamente possibile (non necessariamente in modo meccanizzato). Ma è presumibilmente più complesso configurare in termini sistemistici una poesia come ìlnfinito di'Leopardi.

Page 20

@Il problema della adeguatezza nell'analisi sistemistica dei testi

Il problema più importante è quello della adeguatezza del testo espresso nel linguaggio artificiale rispetto ai contenuti espressi nel testo nel linguaggio naturale in relazione alle finalità di impiego del testo in linguaggio artificiale (adeguatezza delle analisi).

In generale, giudizi sulla adeguatezza della analisi di un testo non potranno essere forniti meccanicamente.

Esistono i seguenti procedimenti per ottenere un giudizio di adeguatezza:

  1. Si sottopone il testo in linguaggio naturale e quello in linguaggio artificiale ad un competente (più competenti) che conosca Fuso del secondo. J) Attraverso un processo di sintesi, si effettua la retroversione del testo in linguaggio artificiale in un testo in linguaggio naturale sottoponendo quest'ultimo a un competente per il confronto con il testo originale, sempre tenendo conto delle finalità.

    Se si segue il secondo procedimento, il giudizio di adeguatezza non implica la conoscenza del linguaggio artificiale; l'eventuale inadeguatezza (ovvero la non adeguatezza) potrà essere imputata sia al processo di analisi che alla retroversione (sintesi);

    Si noti esplicitamente che l'effettuazione della retroversione rende disponibile un testo in linguaggio naturale impiegabile in applicazioni.

    @Analisi diretta da obbiettivi

    Qualora lo scopo dell'analisi sistemistica del testo non sia di formalizzare «tutti» i contenuti dello stesso, ma piuttosto l'estrazione di una loro parte in funzione di scopi, parleremo di «analisi diretta dagli obbiettivi».

    L'adozione di criteri restrittivi di analisi...

Per continuare a leggere

RICHIEDI UNA PROVA

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT