THES/BID: un thesaurus per l'informatica giuridica e il diritto dell'informatica, redatto con l'ausilio dell'elaboratore elettronico

AutoreCostantino Ciampi/Elio Fameli/Sandro Ricci/Giuseppe Trivisonno
CaricaGli Autori sono ricercatori del CNR presso l'Istituto per la documentazione giuridica di Firenze
Pagine155-200

Page 155

La relazione qui di seguito pubblicata ha per oggetto la descrizione della metodologia e delle procedure di lavoro seguite nella costruzione d'un thesaurus settoriale, realizzato da un gruppo di ricercatori dell'Istituto per la documentazione giuridica del CNR e recentemente pubblicato dalla Casa editrice Le Monnier col titolo THES/BID: A Computer-based Thesaurus of Terminohgy in Computers and the Law; non verrà pertanto fatto riferimento né al dibattito teorico sui sistemi di classificazione e indicizzazione con riguardo all'uso dei thesauri (sui quali esiste ormai una vasta letteratura cui in questa sede sì rinvia), né alle inizittive dei numerosi organismi internazionali operanti nel campo della gestione delle informazioni e della standardizzazione che hanno portato all'individuazione di norme tecniche precise per la redazione di questi ormai indispensabili strumenti documentati.

@1. Gli scopi e le caratteristiche generali dell'opera realizzata

THES/BID è un thesaurus strutturato dei descrittori (parole chiave e locuzioni) in lingua inglese impiegati nell'ambito della «Bibliografia internazionale d'informatica e diritto» (BID) e del corrispondente archivio interrogabile on line1 per indicizzare e reperire il materiale bibliografico relativo al-Page 156l'informatica, ale sue applicazioni nel campo del diritto e ai problemi giuridici connessi. L'opera rappresenta il primo tentativo organico di sistematizzazione generale dei concetti ricorrenti nel campo del'informatica giuridica e del diritto delfiniormatici e si propone quindi all'attenzione non solo dei documentalisti» dei lettori della «Bibliografia» e degli utenti di BID, ma anche di tutti coloro che sono comunque interessati a questa nuova disciplina,

THES/BID è stato compilato con l'ausìlio d'un elaboratore elettronico, impiegando procedure automatiche di controllo e di stampa appositamente predisposte per agevolare il lavoro dei redattori. La descrizione delle procedure e dei programmi, concepiti secondo metodologie originai, è Svolta in maniera analitica e dettagliata all'interno del § 3 di questa relazione; gli Autori hanno ritenuto infatti che l'esperienza maturata nella costruzione di THES/BID potesse essere proficuamente utilizzata nella redazione di altri thesauri, in settori disciplinari diversi.

Nella prima fase del lavoro, dalla letteratura specialistica analizzata per la «Bibliografia internazionale» in un arco di tempo ormai quasi decennale sono stati selezionati, non soltanto sulla base della loro frequenza d'uso ma anche su quella della loro significatività, circa 2,000 descrittori; una volta normalizzati (secondo i criteri esposti nel § 2), questi sono stati numerati progressivamente e quindi classificati con l'apposizione di codici derivati da un apposito schema (Classification Table), utilizzato anche per la classificazione delle unità bibliografiche di BID. Questi dati sono stati raccolti in un archivio elettronico denominato MASTER, mentre in un archivio separato,Page 157 chiamato NOTE, sono stati via via registrati i termini non accettati e le annotazioni particolari (Scope Notes) relative all'uso di alcuni descrittori.

In una seconda fase del lavoro sono stati individuati i principali rapporti, di tipo verticale (gerarchie. concettuali) e di tipo orizzontale (sinonimia, quasi-sinonimit e altre relazioni di tipo associativo), esistenti tra i diversi descrittori selezionati; sono stati inoltre fissati i rinvii dai termini esclusi a quelli accolti nel Thesaurus e i collegamenti tra alcune annotazioni particolari registrare in NOTE e i descrittori cui esse si riferiscono, Le relazioni tra i descrittori (compresi i rinvii e i collegamenti), dopo essere state codificate sono state inserite in un archivio elettronico chiamato RELAT.

L'elaboratore elettronico, sella base d'un insieme di programmi appositamente redatti2, ha effettuato una prima serie di controlli sui tre archivi (MASTER, NOTE, RELAT), verificando l'esattezza formale delle classificazioni e delle codificazioni ed eliminando le eventuali duplicazioni di stringhe.

Successivamente, sulla base delle proprietà preventivamente definite per gli operatori relazionali, l'elaboratore ha sviluppato la rete di relazioni registrata in RELAT. Lo sviluppo delle proprietà di reciprocità, simmetria e transitività di alcuni operatori, da una parte e il controllo, anch'esso automatico, della proprietà di irrifiessività e di altre proprietà rilevanti delle strutture algebriche generate dalle reti di, relazioni dall'altra, hanno permesso d'ampliare notevolmente il numero dei rapporti originariamente definiti e, nel contempo, di depurare il Thesaurus dagli inevitabili errori. Particolarmente apprezzabile è stata l'espansione automatica delle relazioni; le oltre 4.000 relazioni inizialmente registrate in RELAT si sono più che raddoppiate mediante l'applicazione della macchina e i dati così ottenuti sono stati organizzati in un nuovo archivio chiamato RELAT FILE ESPANSO.

Le relazioni gerarchiche verticali tra i termini (individuate dall'operatore BT, Broader Terrn, e dal suo reciproco NT, Narrower Term) sono state concepite come strutture algebriche alberiformi, le cui proprietà formali sono state sviluppate e controllate automaticamente. Per ogni insieme di catene gerarchiche aventi una stessa origine concettuale è stato costruito un albero con un'unica radice e numerosi nodi intermedi e finali; all'interno d'ogni albero s'è poi provveduto a controllare, con l'ausìlio della macchina, che non vi fossero salti di gerarchia nel passaggio da un nodo all'altro (nele catene BT/NT) e che ogni nodo avesse un solo superiore gerarchico,

Le relazioni orizzontali di sinonimia, quasi-sinonimia e associazione tra ì termini (individuate dall'operatore RT, Related Term, e sviluppate automaticamente secondo le proprietà di simmetria e transitività unidirezionale) sono state invece concepite come strutture algebriche reticolari, non cicliche; anch'esse sono state controllate automaticamente, onde evitare errori logici ePage 158 ridondanze e, sempre con l'ausilio della macchina, è stata verificata l'osservanza della regola d'incompatibilità tra la relazione di BT e quela di RT per coppie uguali di termini,

Dell'elaboratore ci s'è avvalsi, infine anche per organizzare graficamente la stampa dei numerosi indici e liste di cui il Thesaurus è composto nell'attuale edizione.

Da quanto fin qui esposto e si chiarirà meglio nel seguito risulta che THES/BID ha caratteristiche particolari che lo distinguono da altri thesauri. In primo luogo esso è costruito a posteriori sula base dell'analisi lessicale svolta sui titoli e sugi abstracts delle unità bibliografiche selezionate per la «Bibliografia»; questa caratteristica lo oppone alla categoria dei thesauri costruiti a priori, prima cioè dell'organizzazione d'un sistema di documentazione nel particolare settore applicativo. In secondo luogo THES/BID è composto, oltre che da singole parole chitve, anche da descrittori pluri-termini che individuano concetti complessi e articolati; questa scelta, se da un lato ha incrementato notevolmente il numero dei termini accolti, dall'altro ha permesso una maggiore precisione nella descrizione del contenuto dei documenti, limitando notevolmente i rischi legati ala post-coordinazione dei descrittori monotermini. In terzo luogo, la scelta metodologica fondamentale d'associare a ogni descrittore un numero didentificazione ha consentito di rendere le varie procedure di controllo, elaborazione ed espansione indipendenti dalla forma linguìstica impiegata; i vantaggi principali che ne derivano attengono al risparmio di memoria, alla velocità d'esecuzione dei programmi e ala possibilità di tradurre facilmente il Thesaurus in altre lingue.

Quanto alla struttura, THES/BID si presenta non come una semplice lista di termini ammessi (authority list), ma come un vocabolario strutturato di descrittori in cui sono individuate oltre alle relazioni di preferenza, le relazioni gerarchiche e quelle di sinonimia, quasi-sinonimia e associazione. I descrittori così strutturati poi, vengono presentati non solo in liste alfabetiche e in liste gerarchiche (ordinate dal concetto più ampio a quelo più specifico), ma anche in liste organizzate per classi secondo l'ordinamento sistematico delle voci e sottovoci del particolare schema di classificazione adottato per BID, Quest'ultimo tipo di ordinamento rappresenta un'utile sintesi tra le tecniche dell'indicizzazione e quelle della classificazione, mettendo a disposizione dell'utente i vantaggi di entrambe e riducendo nel contempo i limiti intrinseci di ognuna.

Infine, l'impiego dell'elaboratore, liberando i redattori del Thesaurms da una serie di compiti puramente meccanici e ripetitivi (quali gli ordinamenti dei descrittori, i controlli formali nell'applicazione delle regole di costruzione ed espansione delle relazioni e l'organizzazione grafica degli indici), ha consentito loro di concentrarsi quasi esclusivamente siila definizione dei criteri da seguire nella realizzazione dell'opera (selezione, normalizzazione e strutturazione dei termini) e sull'applicazione delle regole prefissate (proprietà deiePage 159 relazioni e delle strutture algebridhe utilizzate, individuazione delle incompatibilità e delle ridondanze all'interno di queste ultime), Tale applicazione è stata particolarmente rigorosa e coerente in quanto s'è provveduto a formalizzare le regole e a tradurle in istruzioni di programma; l'elaboratore è stato così messo in grado di svolgere un vero e proprio lavoro di sviluppo delle relazioni, di controllo su di esse e di supporto nella costruzione delle, strutture concettuali.

Considerati nel loro insieme, i numerosi programmi realizzati (22 programmi in linguaggio PL/1, per un totale di 2.440 istruzioni, cui vanno aggiunte 450 istruzioni raccolte in 14 «exec» funzionanti nell'ambito del sistema operativo CMS) sulla base delle regole formalizzate (40 regole, la cui applicazione è...

Per continuare a leggere

RICHIEDI UNA PROVA

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT