Open Data: la piattaforma di dati aperti per il Linked Data

AutoreGiuseppe Rizzo - Federico Morando - Juan Carlos de Martin
Pagine493-511
Open Data: la piattaforma di dati aperti per il Linked Data
GIUS EP PE RIZZO , FED ERICO MO RA NDO , JUAN CA RLO S DEMARTIN
SOMM ARI O:1. Introduzione – 2. Interoperabilità tra i dati – 3. Tecnologieper favorire
l’interoperabilità: RDF e SPARQL – 3.1. Resource Description Framework (RDF)
– 3.2. SPARQL Protocoland RDF Quer y Language (SPARQL) – 4. Linee guida per
la pubblicazione dei dati – 5. Pubblicare i Linked Data – 5.1. Pubblicazione di dati
strutturati – 5.2. Pubblicazione di dati non strutturati: testo – 6. Open Data incontra
il Linked Data – 6.1. Open Data eOpen Licenses – 7. Creare i link verso archivi
esterni – 8. Conclusioni
1. INT RODU ZI ON E
Il world wide web, o semplicemente web, ha radicalmente alterato il modo
di condividere i contenuti ed informazioni di ogni tipo, facilitando la pub-
blicazione degli stessi da parte degli autori e l’accesso per i lettori. Questi
ultimi hanno potuto contare sull’abbattimento delle barriere di accesso, po-
tendo così navigare liberamente tra una molteplicità di oggetti immateriali
creati dall’uomo (“artefatti”) utilizzando il web come uno spazio di infor-
mazione globale. Il world wide web si presenta dunque come strumento
atto a veicolare informazioni eterogenee, le quali possono essere raccolte e
catalogate all’interno di quello che può essere def‌inito il più vasto archivio
della conoscenza umana. Le informazioni sono intrecciate tra loro, median-
te dei collegamenti ipertestuali, chiamati hyperlink. L’indicizzazione degli
hyperlink permette di creare delle associazioni tra le informazioni e le parole
chiave, favorendo al lettore un punto di accesso ad ulteriore conoscenza.
Il web, dalla sua nascita, ha conservato queste peculiarità, che lo hanno
reso una tecnologia di grande successo ed in continua crescita1. Tuttavia,
sino ad ora, esso è stato utilizzato principalmente per condividere artefatti
come i documenti complessi. Sfruttare adeguatamente i principi che il web
G. Rizzo è dottorando di ricerca in Ingegneria informatica e dei sistemi presso il Di-
partimento di Automatica e informatica del Politecnico di Torino; F. Morando è managing
director eresearch fellow presso il centro NEXA del Politecnico di Torino; J.C. De Martin è
co-fondatore e co-direttore del centroNEXA e professore associato al Politecnico di Torino.
1C. BIZE R, T. HEAT H, T. BERN ERS -LEE,Linked Data - The Story So Far, in “The
International Journal on Semantic Web and Information Systems”, Vol. 5, 2009, n. 3,
pp. 1-22.
494 Informatica e diritto /I linguaggi, gli strumenti e le applicazioni
ha seguito per anni, ma al f‌ine di condividere dati elementari, è uno dei prin-
cipali temi attuali di ricerca nella comunità degli studiosi di Internet. L’unità
di base di scambio dell’informazione passa così dal documento al dato grez-
zo, raw. Ciò permette di separare in modo embrionale il contenuto di un
artefatto in tante parti, potendo collegare tra loro o con altre informazioni
i dati presenti all’interno dell’artefatto stesso, al f‌ine di inferire nuove infor-
mazioni o creare nuovi artefatti. Adottando l’immagine proposta dall’inven-
tore del web, Tim Berners-Lee, possiamo affermare che l’artefatto è qualcosa
che possiamo semplicemente leggere, mentre un dato può essere processato
in differenti modi per creare nuova informazione. In questo modo, il web
diventa uno spazio di condivisione globale dei dati, il web of Data. La spe-
cializzazione introdotta dal web of Data permette di strutturare i dati della
risorsa, in modo che essi possano essere letti separatamente e all’occorren-
za, per rispondere alle richieste dell’utente, aggregati con altri. Tipicamente
un insieme di dati contiene una conoscenza circa un dominio particolare,
come f‌ilm, musica o viaggi. Se questi insiemi di dati sono tra loro intercon-
nessi, una macchina può navigare attraverso le relazioni create, senza subire
l’effetto del rumore.
Nel web a cui siamo abituati, le risorse sono descritte in HTML - Hyper-
text Markup Language e pubblicate in spazi di aggregazione, quale i siti. La
domanda da parte dei lettori di informazioni processabili dalle macchine ha
spinto i creatori a pubblicare dati strutturati: esempi di questo sono i dati
che spesso provengono da tabelle di vario tipo e sono poi esposti sul web in
formato CSV - Comma Separated Value, XML - eXtensible Markup Langua-
ge o tramite delle tabelle nelle pagine HTML, sacrif‌icando gran parte della
semantica della risorsa iniziale. La natura delle relazioni tra due risorse colle-
gate è implicita, ossia l’informazione di collegamento è annegata all’interno
della risorsa stessa, poiché l’HTML non è un linguaggio suff‌icientemente
espressivo per gestire le inferenze tra differenti risorse. Da qui l’esigenza
di poter descrivere i dati in maniera strutturata sfruttando formati in grado
di gestire la relazione tra gli stessi. Per rispondere a questa esigenza, il web
sta evolvendo da spazio di raccolta e collegamento di documenti ad uno in
cui i dati grezzi contenuti nelle risorse sono collegati o collegabili facilmen-
te dalle macchine. Questa evoluzione è conosciuta con il nome di Linked
Data. Il Linked Data è una metodologia che permette di aggregare e colle-
zionare dati provenienti da fonti distribuite2. Per rendere completamente
2C. BIZE R, T. HEATH, D. AY ERS, Y. RAI MON D,Interlinking Open Data on the Web, in
“The 4th European Semantic WebConference”, 2007.

Per continuare a leggere

RICHIEDI UNA PROVA

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT