Open Data: la piattaforma di dati aperti per il Linked Data

Autore:Giuseppe Rizzo - Federico Morando - Juan Carlos de Martin
Pagine:493-511
RIEPILOGO

A large amount of data is spread across the Internet and an increasingly large number of users is making advanced uses of them. These data transport raw information, which may be used to enrich existing data, creating new Knowledge about their context thanks to the aggregation with other data. Historically, the Web has been a system where many documents have been collected and linked together. Indeed, the Web has been considered a document aggregator. For this reason it is becoming the ideal system to enable aggregation among data and to deliver data to a large network of consumers, but also producers ... (visualizza il riepilogo completo)

 
ESTRATTO GRATUITO
Open Data: la piattaforma di dati aperti per il Linked Data
GIUS EP PE RIZZO , FED ERICO MO RA NDO , JUAN CA RLO S DEMARTIN
SOMM ARI O:1. Introduzione – 2. Interoperabilità tra i dati – 3. Tecnologieper favorire
l’interoperabilità: RDF e SPARQL – 3.1. Resource Description Framework (RDF)
– 3.2. SPARQL Protocoland RDF Quer y Language (SPARQL) – 4. Linee guida per
la pubblicazione dei dati – 5. Pubblicare i Linked Data – 5.1. Pubblicazione di dati
strutturati – 5.2. Pubblicazione di dati non strutturati: testo – 6. Open Data incontra
il Linked Data – 6.1. Open Data eOpen Licenses – 7. Creare i link verso archivi
esterni – 8. Conclusioni
1. INT RODU ZI ON E
Il world wide web, o semplicemente web, ha radicalmente alterato il modo
di condividere i contenuti ed informazioni di ogni tipo, facilitando la pub-
blicazione degli stessi da parte degli autori e l’accesso per i lettori. Questi
ultimi hanno potuto contare sull’abbattimento delle barriere di accesso, po-
tendo così navigare liberamente tra una molteplicità di oggetti immateriali
creati dall’uomo (“artefatti”) utilizzando il web come uno spazio di infor-
mazione globale. Il world wide web si presenta dunque come strumento
atto a veicolare informazioni eterogenee, le quali possono essere raccolte e
catalogate all’interno di quello che può essere definito il più vasto archivio
della conoscenza umana. Le informazioni sono intrecciate tra loro, median-
te dei collegamenti ipertestuali, chiamati hyperlink. L’indicizzazione degli
hyperlink permette di creare delle associazioni tra le informazioni e le parole
chiave, favorendo al lettore un punto di accesso ad ulteriore conoscenza.
Il web, dalla sua nascita, ha conservato queste peculiarità, che lo hanno
reso una tecnologia di grande successo ed in continua crescita1. Tuttavia,
sino ad ora, esso è stato utilizzato principalmente per condividere artefatti
come i documenti complessi. Sfruttare adeguatamente i principi che il web
G. Rizzo è dottorando di ricerca in Ingegneria informatica e dei sistemi presso il Di-
partimento di Automatica e informatica del Politecnico di Torino; F. Morando è managing
director eresearch fellow presso il centro NEXA del Politecnico di Torino; J.C. De Martin è
co-fondatore e co-direttore del centroNEXA e professore associato al Politecnico di Torino.
1C. BIZE R, T. HEAT H, T. BERN ERS -LEE,Linked Data - The Story So Far, in “The
International Journal on Semantic Web and Information Systems”, Vol. 5, 2009, n. 3,
pp. 1-22.
494 Informatica e diritto /I linguaggi, gli strumenti e le applicazioni
ha seguito per anni, ma al fine di condividere dati elementari, è uno dei prin-
cipali temi attuali di ricerca nella comunità degli studiosi di Internet. L’unità
di base di scambio dell’informazione passa così dal documento al dato grez-
zo, raw. Ciò permette di separare in modo embrionale il contenuto di un
artefatto in tante parti, potendo collegare tra loro o con altre informazioni
i dati presenti all’interno dell’artefatto stesso, al fine di inferire nuove infor-
mazioni o creare nuovi artefatti. Adottando l’immagine proposta dall’inven-
tore del web, Tim Berners-Lee, possiamo affermare che l’artefatto è qualcosa
che possiamo semplicemente leggere, mentre un dato può essere processato
in differenti modi per creare nuova informazione. In questo modo, il web
diventa uno spazio di condivisione globale dei dati, il web of Data. La spe-
cializzazione introdotta dal web of Data permette di strutturare i dati della
risorsa, in modo che essi possano essere letti separatamente e all’occorren-
za, per rispondere alle richieste dell’utente, aggregati con altri. Tipicamente
un insieme di dati contiene una conoscenza circa un dominio particolare,
come film, musica o viaggi. Se questi insiemi di dati sono tra loro intercon-
nessi, una macchina può navigare attraverso le relazioni create, senza subire
l’effetto del rumore.
Nel web a cui siamo abituati, le risorse sono descritte in HTML - Hyper-
text Markup Language e pubblicate in spazi di aggregazione, quale i siti. La
domanda da parte dei lettori di informazioni processabili dalle macchine ha
spinto i creatori a pubblicare dati strutturati: esempi di questo sono i dati
che spesso provengono da tabelle di vario tipo e sono poi esposti sul web in
formato CSV - Comma Separated Value, XML - eXtensible Markup Langua-
ge o tramite delle tabelle nelle pagine HTML, sacrificando gran parte della
semantica della risorsa iniziale. La natura delle relazioni tra due risorse colle-
gate è implicita, ossia l’informazione di collegamento è annegata all’interno
della risorsa stessa, poiché l’HTML non è un linguaggio sufficientemente
espressivo per gestire le inferenze tra differenti risorse. Da qui l’esigenza
di poter descrivere i dati in maniera strutturata sfruttando formati in grado
di gestire la relazione tra gli stessi. Per rispondere a questa esigenza, il web
sta evolvendo da spazio di raccolta e collegamento di documenti ad uno in
cui i dati grezzi contenuti nelle risorse sono collegati o collegabili facilmen-
te dalle macchine. Questa evoluzione è conosciuta con il nome di Linked
Data. Il Linked Data è una metodologia che permette di aggregare e colle-
zionare dati provenienti da fonti distribuite2. Per rendere completamente
2C. BIZE R, T. HEATH, D. AY ERS, Y. RAI MON D,Interlinking Open Data on the Web, in
“The 4th European Semantic WebConference”, 2007.

Per continuare a leggere

RICHIEDI UNA PROVA