Semantic Web Ontologie - Dipartimento di Informatica

Semantic Web
Ontologie
SCHEMA (ontologia)
vocabolario
che esperime le relazioni fra concetti, che
diventano classi di dati
METADATI
riportano questi dati ai
concetti di uno schema
DATI
distribuiti nel Web
Esigenza di introdurre metadati (dati che descrivono dati) per mappare
i dati rispetto a classi, o concetti, di questo schema di dominio
1
MOTIVAZIONI ALL’USO DELLE ONTOLOGIE
Per raggiungere gli obiettivi del Sem web,
Integrazione di informazioni
L’integrazione di dati eterogenei presuppone che le applicazioni
condividano lo stesso vocabolario (SCHEMA)
Condivisione di conoscenza
Riuso di conoscenza
Diverse applicazioni accedono
alla medesima conoscenza
Diverse applicazioni riusano la
medesima conoscenza
COSA SONO LE ONTOLOGIE
Nell’ambito della filosofia, rappresenta una branca della
metafisica che studia la natura di ciò che esiste. Si occupa di
dare risposte a domande del tipo: cos’è l’esistenza? Quali
proprietà possono spiegarla? Come queste proprietà la
spiegano?
Nell’ambito dell’Intelligenza Artificiale, indica la specificazione
di una concettualizzazione ovvero una descrizione formale di un
insieme di concetti e delle relazioni che intercorrono tra essi.
2
QUALCHE DEFINIZIONE
“Un’ontologia fornisce i termini per descrivere esplicitamente la
concettualizzazione che sta dietro la conoscenza rappresentata
nella base di conoscenza”
[Bernaras&other, 96]
“L’ontologia e’ vista come un vocabolario di concetti, che
rappresenta un determinato dominio di interesse, dotato di un
insieme di relazioni tra i concetti stessi che consentono di capire
come sono legati fra loro”
[Josephson&other, 99]
“Un’ontologia e’ una collezione di frasi che definiscono le relazioni
tra concetti e specificano le regole logiche”
[Tim Berners-Lee, 99]
“L’ontologia e’ una esplicita e formale rappresentazione di una
concettualizzazione condivisa”
[Gruber, 96]
 “concettualizzazione”:
modello astratto e semplificato che identifica
i concetti rilevanti del mondo che noi desideriamo rappresentare
 “esplicita”:
i tipi di concetti usati e le restrizioni devono essere
definiti dichiaratamente
 “formale”:
deve essere machine-processable
 “condivisa”:
una ontologia cattura una conoscenza consensuale, non
ristretta a qualche individuo
3
LA CONCETTUALIZZAZIONE
“Concettualizzazione”: modello astratto e semplificato che identifica i
concetti rilevanti del mondo che noi desideriamo rappresentare
Essa e’ indipendente dal vocabolario usato (es.lingua)
Differenti situazioni possono coinvolgere lo stesso concetto descritto
attraverso vocabolari diversi.
MELA
APPLE
IN SINTESI…
In sintesi, un’ontologia descrive formalmente il dominio di un
discorso e consiste in:
  una
lista finita di termini che denotano concetti (ossia classi di
oggetti) del dominio
  relazioni
tra concetti: gerarchie di classi, proprietà,
restrizioni di valori, relazioni logiche e di disgiunzione
4
ONTOLOGIE NEL WEB
  consentono la strutturazione delle informazioni (lato back
end)
  consentono di esplicitare la semantica delle pagine web
(lato front end)
  permette di superare alcuni aspetti critici del Web
tradizionale
ONTOLOGIE E SEMANTIC WEB
L’introduzione delle ontologie nel Web consente:
 
interoperabilità: condividere una comprensione comune della
struttura dell’informazione in un gruppo
 
riuso della conoscenza del dominio, per non duplicare sforzi nello
sviluppo di sistemi software
 
separazione della conoscenza dichiarativa sul dominio dalla
conoscenza procedurale
 
comunicazione tra agenti sw e tra sw e umani, fornendo una
terminologia comune
 
esplicitare le assunzioni sul dominio
5
Tassonomia vr Ontologia…
•
Taxonomy is an organized set of terms in a hierarchy,
relationship like “is-a type” in a classification. The tree
structure constrains the semantic interpretation. Basic form
of reasoning : classification (inserting an instance in the
correct level of the hierarchy), and inheritage (inferring the
properties of a concept basing on properties of its parents)
• 
Ontology provides both well-defined and relational structure
and explicit and formal semantic for machine processing. An
ontology (since can be expressed by Description Logic based languages) exploits basic reasoning mechanism in the
form of axiomslike subsupmtion, equivalence, disjointness.
• 
Database vr
Scopo: archiviare dati .
Rappresenta informazioni piatte
(sotto forma di record)
Relazioni: gli unici legami possibili
sono di tipo relazionale (basati
su chiavi relazionali)
Sono possibili relazioni di
diversa cardinalità: 1:1 o 1:n o
m:n)
Semantica: nei db non c'è alcuna
semantica a meno che non sia
aggiunta dall'esterno
Ontologia
Scopo: descrivere una struttura e dare
delle preinformazioni sugli
oggetti (che tipo di dati accettano,
con quali altri oggetti si
collegano). Le istanze sono
rappresentate a parte
Relazioni: le ontologie consentono
di rappresentare legami
(semantici) più ricchi e
relazioni come IS_A oppure di
altro tipo (part_of, belongs..)
Semantica: le ontologie contengono
la semantica all’interno della
loro struttura
6
ELEMENTI DELLE ONTOLOGIE
Classi
Classi organizzate in tassonomie, relazioni di specializzazione e
generalizzazione.
La “classe” viene utilizzata per descrivere i concetti (le classi di individui)
che si vuole rappresentare (es. PERSONA, GENITORE, MADRE…)
FEMMINA
PERSONA
DONNA
GENITORE
subClassOf
subClassOf
MADRE
PADRE
ELEMENTI DELLE ONTOLOGIE
Proprieta’ e attributi
Rappresentano le relazioni esistenti tra le classi del dominio (es. “le MADRI
sono GENITORI”, “i GENITORI hanno figli che sono PERSONE”…)
FEMMINA
PERSONA
r
ha_figli
DONNA
GENITORE
(1,n)
is_a
MADRE
PADRE
7
ELEMENTI DELLE ONTOLOGIE
Proprieta’ e attributi
•  Il legame tra MADRE e GENITORE (is_a) indica che “le MADRI
sono GENITORI” e definisce una gerarchia tra concetti, provvedendo
una base per l’eredità di proprietà: un concetto specifico eredita le
proprietà del concetto più generale che lo sussume
•  E’ possibile rappresentare anche proprietà più complesse della
relazione is_a
•  la proprietà ha_figli, che connette le classi GENITORE e PERSONA,
specificando degli attributi che ne vincolano l’applicazione: r denota
una restrizione sulle classi che possono soddisfare la proprietà, mentre
(1,n) rappresenta una restrizione di cardinalità
L’esempio può essere letto come “un GENITORE è una PERSONA
che ha almeno 1 figlio e tutti i figli che ha sono PERSONE”
ELEMENTI DELLE ONTOLOGIE
Individui (o Istanze)
Sono i singoli oggetti contenuti in una classe, a vari livelli di generalità,
a seconda dello scopo dell’ontologia
FEMMINA
DONNA
MADRE
Luisa, Anna,
Maria,…
PERSONA
GENITORE
PADRE
Luca,
Claudio,…
8
ELEMENTI DELLE ONTOLOGIE
Assiomi
Possono essere utilizzati per diversi scopi: definire il significato dei
vari componenti dell’ontologia, definire relazioni complesse,
verificare la correttezza dell’informazione specificata o dedurre nuova
informazione
Ex. disjoint (MADRE, PADRE) esprime il fatto che un elemento della
classe PADRE non può mai essere anche un elemento della classe
MADRE)
GENITORE
MADRE
disjoint
PADRE
ELEMENTI DELLE ONTOLOGIE
Il contenuto di un’ontologia è quindi rappresentato da:
 Un insieme di classi (concetti – astrazioni del mondo reale).
 Un insieme di relazioni (tra 2 classi);
 Un insieme di assiomi
 Un insieme di individui
Una base di conoscenza (knowledge base) sulla quale poter eseguire
elaborazioni è data allora da:
 Ontologia + Istanze delle classe dell’ontologia
9
4. TIPI DI ONTOLOGIE
(facoltativo)
TIPI DI ONTOLOGIE
Domain independent
Example:medicine,physics,etc.
.
Example:selling,teaching,etc..
10
Domain Ontologies
•  Una domain ontology modella una parte del mondo, uno
specifico dominio.
Rappresenta il particolare significato dei termini in quello
specifico ambito.
Ad esempio, la parola albero ha molti diversi significati.
Un ontologia riguardante il dominio della botanica
modellera’ il significato di “pianta”, mentre una ontologia
riguardante l’informatica modellera’ il significato di
“struttura dati” , una ontologia autica “parte di una
imbarcazione”
Upper Ontologies
•  Una upper ontology (o foundation ontology o top level
ontology) e’ un modello degli oggetti comuni che sono
genericamente applicabili ad un ampio raggio di ontologie
di dominio.
•  Contiene un glossario in cui gli oggetti possono essere
descritti in differenti domini
•  Ci sono una serie di standard
– 
– 
– 
– 
SUMO
OpenCyc/ResearchCyc
DOLCE
GFO
NB: WordNet, sebbene condiderata una upper ontology, non e’
un’ontologia: essa e’ la combinazione tra una tassonomia e un
vocabolario controllato
11
Upper Ontologies: SUMO
•  Suggested Upper Merged Ontology  IEEE (Institute of
Electrical and Electronic Engineering), meta anni ‘90. http://
suo.ieee.org/;
•  “upper ontology” per i computer per interoperabilità dei dati,
la ricerca di informazioni, ragionamento automatico e
elaborazione del linguaggio naturale
•  fornisce una struttura e un insieme di concetti generali sulla
base dei quali potranno essere costruite le ontologie di
dominio
Upper Ontologies: OpenCyc
•  ontologia pubblica sviluppata nell’ambito del progetto Cyc.
(nato nel 1984 e ancora in corso www.opencyc.org/).
•  Cyc è proprietaria: include un'ontologia di base e diverse
ontologie specializzate per dominio. Un sottoinsieme è stato
rilasciato per uso libero col nome di OpenCyc.
•  codificata la conoscenza di senso comune; Cyc include oltre un
milione di concetti, OpenCyc: 6.000 e 60.000 relazioni
12
Upper Ontologies: DOLCE
•  Descriptive Ontology for Linguistic and Cognitive
Engineering by CNR (Trento e Roma).
•  non vuole essere un’ontologia universale (non tenta di essere
adottabile in ogni dominio), punto di partenza per chiarire la
relazioni esistenti tra diverse ontologie di dominio e per
rendere esplicite le assunzioni presenti nelle ontologie
preesistenti.
•  orientamento cognitivo, esprime le categorie ontologiche alla
base del linguaggio naturale e del senso comune umano.
WordNet
•  WordNet è una risorsa linguistica sviluppata più di dieci
anni fa dal’Università di Princeton, che organizza,
definisce, descrive i concetti rilevanti della lingua inglese.
•  La concettualizzazione del lessico è realizzata attraverso
il synset, insieme di termini dal significato equivalente,
strutturati in nodi e collegati da relazioni di senso: iper/
iponimia, mereonimia, etc..; Disambiguazione dei
polisensi
•  WordNet, considerato uno dei più importanti lessici
standard per la lingua inglese, è disponibile gratuitamente
su Internet, sia consultabile on line che scaricabile;
13
Utilita’ di upper ontologies
•  Dal momento che le domain ontologies
rappresentano concetti in modo molto specifico, sono
spesso incompatibili.
•  I sistemi spesso necessitano di unire (merge)
domain ontologies in una rappresentazione piu’
generale.
•  L’operazione di merging e’ un problema :
–  fra ontologie di domini diversi.
–  fra ontologie nello stesso dominio (possono essere diverse
perche’ esprimono differenti visioni basati su differenze
culturali)
•  Il merging e’ un processo manuale, time-consuming
e dispendioso. L’uso di una foundation ontology per
avere una definizione comune dei termini chiave
semplifica il processo
5. ONTOLOGY REASONING
(facoltativo)
14
Ontology reasoning
•  ereditarieta’ (sussunzione):
inferire le proprieta’ di un concetto a partire della proprieta’ delle sue
sovracclassi
•  equivalenza di classi.
Se la classe A è equivalente alla classe B, e la classe B è equivalente alla
classe C, allora si può inferire che A è anche equivalente a C
Ontology reasoning
•  appartenenza ad una classe: se x è un’istanza di una classe C e C è una
sottoclasse della classe D, allora si può inferire che x è istanza di D
•  consistenza. Supponiamo di aver dichiarato x come una istanza della classe
A e che A è una sottoclasse di B, A è anche una sottoclasse di D, e B e D sono
disgiunte . Qui abbiamo un’inconsistenza perché A dovrebbe essere vuota,
invece ha l’istanza x. Questa è un’indicazione di un errore dell’ontologia
• classificazione. Inserire un’istanza nel corretto livello della gerarchia. Se
abbiamo dichiarato che una certa coppia attributo-valore è la condizione
sufficiente per l’appartenza alla classe A, e un individuo x soddisfa questa
condizione, allora possiamo concludere che x devere essere un’istanza della
classe A
15
Ontology reasoning
La semantica è il prerequisito per il supporto al reasoning. Derivazioni come
quelle presentate in precedenza possono essere fatte meccanicamente invece
che a mano. Un supporto automatico al ragionamento è utile perché permette
di
–  Controllare la consistenza della ontologia e della conoscenza
–  Controllare le relazioni non previste tra le classi
–  Classificare in modo automatico istanze di una classe
Una semantica formale e un supporto automatico al ragionamento sono di
solito fornite mappando il linguaggio ontologico su un definito formalismo
logico e usando automatismi previsti per quel linguaggio. Per esempio, OWL
è mappato sulla Description Logic (DL) e usa tool di reasoning (Pellet))
16