Reseda, un sistema AI. di «information retrieval» nel campo degli studi storici

Autore:Gian Piero Zarri
Carica:Lavora come « chargé de recherche » presso il Cernire National de la Recherche Scientifique a Parigi
Pagine:89-125
RIEPILOGO

I. La codifica delle In formazioni biografiche. - II. L'interrogazione del sistema e le procedure d'inferenza. - III, Conclusioni,

 
ESTRATTO GRATUITO

Page 89

Gian Piero Zarri è il responsabile del nuovo progetto RESEDA/1 finanziato doli « Institut de Recherche d'Informatique et dfÀutomatique » (contratto m, 78.206); il suo indirizzo è: CNRS - LISHT 54 boulepard Raspati, 75270 Parts Cedex 06, France,

Il progetto RESEDA (REseau SEmantlque DocumentAire) ha preso inizio nell'ottobre 1975 .grazie' al contributo finanziano del C.N.R.S. (Cantre National de la Recherche Scientifique) e della D.G.R.S.T. (Délégation Generale à la Recherche Scientifique et Technique) francesi, contratto tf 75,7.0456, La sua prima fase (progetto RESEDÀ/0) è stata completata nel dicembre 1977. In questo articolo si fornisce una sintesi dei risultati così raggiunti, aggiornando tra l'altro la presentazione del progetto effettuata su questa stessa rivista tramite la pubblicazione del primo (Bozzolo et al., 1917 a) dei quattro rapporti semestrali,- vd. anche Bozzolo et al. (1976, 1917 b), Zarri et al. (1977), cui esso ha per il momento dato origine.

Nel suo aspetto attuale, RESEDA si presenta come un-,sistema sperimentale, « evoluto » (Minker, 1977) di information reiriepal interattivo» inserito su di una base di dati biografici riguardante i « personaggi », pubblici o privati, "che hanno avuto una qualche parte negli inizi (1380-1420) del movimento umanistico in Francia.

Per svolgere il suo ruolo di sistema di documentazione automatica, RESEDA si serve di un doppio- ordine di strumenti:

a) Un metalinguaggio di descrizione delle informazioni, sufficientemente ricco in possibilità espressive così da permettere la rappresentazione di certi dati biografici « astratti »'ma assolutamente essenziali per la descrizione della carriera di un intellettuale, come le manifestazioni di una ideologia politica o religiosa, e il costituirsi e il modificarsi di una fitta rete di atteggiamenti nei confronti di amici ed tvversari.

b) La possibilità di ricorrere ad un sistema di procedure d'inferenza, ad hoc, non universale quindi ma tuttavia estremamente analitico nell'ambito Page 90 degli interessi del sistema, che permetta di rispondere ad una domanda di utiliz2atore quaodo: questa non possa essere soddisfatta da una ricerca di tipo diretto sul contenuto della base di dati.

Le pagine che seguono conterranno una descrizione dei due strumenti qui evocati. L'articolo- sarà concluso da un accenno sulle possibilità di un potenziamento della- versione attuale di RESEDA tramite l'introduzione di un meccanismo di assemblaggio semi-automatico- delle .procedure di inferenza del sistema (progetto RESEDA/i).

@I. La codifica delle informazioni biografiche

Le Informazioni biografiche sui personaggi dell'umanesimo francese che -costituiscono II supporto dati di RESEDA provengono, dall'esame dei tipi più diversi di fonti, documenti d'archivio, opere erudite, articoli su riviste scientifiche» ecc.

Episodi, piani e volumi

La prima operazione compiuta dall'analista In fase di codifica consiste nel- l'isolare, all'Interno di questa massa di Informazioni inorganica e ridondante, una serie di « episodi », cioè una serie di « flash » in lingua naturale dove ognuno di questi descrive una particolare « situazione » di uno o più personaggi, situazione caratterizzata da un riferimento spazio-temporale univoco. Ad esempio, questo seguito di Informazioni: « Clamanges era partito da Parigi per recarsi In Avignone. Là, aveva ritrovato Jean Muret e Jean Moccia, 11 13 novembre 1397, fu nominato segretario pontificio dal papa'Benoit XIII, e conservò questa carica fino al maggio 1398 », risulta . già analizzato In tre episodi distinti che si riferiscono' rispettivamente al viaggio di Clamanges? al soggiorno contemporaneo dei tre amici in Avignone, alla nomina di Clamanges come-segretario.

La riduzione: In episodi dell'informazione storica primaria è un'operazione evidentemente manuale. Ogni velleità di meccanizzazione risulterebbe del tutto assurda di fronte a una documentazione oscillante tra la concisione di un elenco di benefici pontificali attestati da un documento' universitario In latino medievale, e il fuoco- d'artificio delle preziosità linguistiche e degli ammiccamenti culturali di uno storico moderno che scrive nella sua lingua madre. Si aggiunga che l'individuazione degli episodi e la scelta dell'angolazione particolare sotto cui presentarli (non. tutti sono così « Ideologicamente » neutri come I tre sopra citati) sono operazioni eminentemente soggettive in cui è messa in giucco tutta la preparazione culturale dello storico. Si può quindi affermare che la selezione degli episodi, più che la -loro successiva formalizzazione costituisce II momento più difficile e delicato dell'i etera fase di codifica,Page 91

Ad ogni « episodio » In linguaggio naturale corrisponde nella memoria del sistema una particolare associazione di codici numerici che prende il nome di « piano ». La trasformazione dell'episodio in piano- viene realizzata in due fasi successive. Una'prima codifica « esterna », realizzata manualmente dall'analista, conduce ad una rappresentazione formale dell'episodio ottenuta utilizzando i « nomi » in chiaro- delle varie categorie del metalinguaggio-. Sebbene non prevista per il momento, un'automatizzazione di questo passaggio dall'episodio in linguaggio naturale alla forma esterna del piano non è concettualmente impossibile, visto che l'impiego delle categorie del metalinguaggio è regolato da un insieme di norme esaustive ed'univoche. Una seconda trasformazione, automatica, eseguita da un programma che controlla nello stesso tempo la correttezza formale della codifica esterna, conduce alla rappresentazione interna e identifica ogni episodio' sotto forma di due vettori numerici ÀPL. I dettagli dell'organizzazione numerica interna, vd. ad es., Bozzolo et d. (1976), sono evidentemente secondari per quanto riguarda la concezione generale del sistema: la descrizione degli elementi costitutivi di un piano-, come la descrizione della loro- funzione nell'ambito delle procedure d'inferenza, sarà quindi condotta facendo-riferimento al solo livello' « esterno » di codifica.

Si noti che i « piani » sono così chiamati per omaggio a Quillian, e per analogia tra le sue « definizioni di dizionario » (Quillian, 1968) e le situazioni rappresentate negli episodi. Queste infatti-in un certo- senso definiscono, limitatamente al tempo-luogo- considerato, il personaggio o i personaggi coinvolti,

I piani sono organizzati secondo un doppio ordine di indicazioni. Una prima organizzazione, di tipo fisico o-rdina tutti i piani presenti in memoria sequenzialmente, in modo- che 'essi si succedano secondo- « valori » crescenti della data citata, implicitamente o - esplicitamente, nell'episodio. originario. I piani corrispondenti rispettivamente ai tre episodi « viaggio », « soggiorno » e « nomina » della biografia di Clamanges conservano dunque quest'ordine di successione nell'ordinamento di tipo fisico. Si noti come il criterio cronologico impiegato per l'organizzazione di tipo fisico sia .stato particolarmente adattato in modo da tenere conto- delle incertezze e delle imprecisioni proprie alla documentazione medievale, cioè di espressioni del tipo « prima del 13 novembre 1397 », « verso il mese di maggio 1398 », ecc.

L'organizzazione logica distribuisce invece i piani in differenti « volumi », dove ogni volume è .attribuito ad un solo personaggio, la vedette, il criterio di attribuzione di un piano ad un determinato' volume consiste nella presenza 'della vedette del volume nella formulazione dell'episodio che'-il piano traduce. Se un episodio riguarda più personaggi contemporaneamente, il piano= corrispondente farà parte nello stesso- tempo' ' di più volumi (Scragg, 1975): ogni volume non è -altro allora che una lista di indirizzi che « puntano » vqrso le etichette dei piani (inverted file). II piano rela-Page 92 tivo all'episodio « viaggio di Clamanges » sarà incluso nel solo volume

Clamanges

; quello corrispondente all'episodio « soggiorno » nei volu-mi di Clamanges, Muret e Moccia; il piano « nomina » sarà infine incluso tanto nel volume di Clamanges che in quello del papa Benott,

All'interno dei piani: tematica e descrizione

Una delle decisioni fondamentali prese, a proposito della trasformazione degli episodi in piani riguarda la scelta di effettuare in modo distinto la codifica delle informazioni che formano il quadro spazio-temporale dell'episodio (« tematica »), e la codifica della vera e propria parte descrittiva dell'episodio (« descrizione »). Hanno contribuito a questa decisione tanto delle ragioni di ordine pratico come la possibilità di accedere subito, senza necessità di analizzare la codifica della parte descrittiva, alle informazioni-quadro che permettono- da sole di orientare certi tipi di ricerca, e delle ragioni più « teoriche » associate alla presenza nel piano di un solo « predicato » (vd. oltre).

La tematica di un piano comprende dunque la codifica, ripartita su differenti zone, delle indicazioni « tempo » e « luogo » dell'episodio. Sono inoltre associate alla " tematica le indicazioni in codice (normalmente, dei riferimenti bibliografici) che permettono di individuare 1' « informatore » (nel senso più ampio della parola) all'origine delle notizie riportate.

Le prime sette zone della tematica sono- sempre obbligatoriamente presenti. Di queste le prime due sono-riservate alla codifica delle informazioni temporali, Solo, la prima sarà effettivamente riempita (cioè sarà completata con un codice diverso dal « simbolo vuoto », « b ») se lo « stato » rappresentato dal predicato dell'episodio è spontaneamente associabile nella sua globali ti ad un punto ben determinato lungo- Passe dei tempi (ad esempio: « Clamanges scrive questa lettera il 25 luglio 1394 »), oppure se può essere « forzato » in un punto in quanto si prende in esame P'inizio di un nuovo stato (« Clamanges comincia a scrivere questa lettera il 25 luglio 1394 »), la fine(« Clamanges termina questa lettera il 25 luglio 1394 ») o un istante hem...

Per continuare a leggere

RICHIEDI UNA PROVA