-
Aalto-yliopisto
Perustieteiden korkeakoulu
Tietotekniikan tutkinto-ohjelma
Sini Pessala
Linkitettyjen kevytontologioiden muutostenkuvaaminen
DiplomityöEspoo, 9. huhtikuuta 2015
Valvoja: Professori Eero HyvönenOhjaaja: Diplomi-insinööri
Matias Frosterus
Filosofian maisteri Jouni Tuominen
-
Aalto-yliopistoPerustieteiden korkeakouluTietotekniikan
tutkinto-ohjelma
DIPLOMITYÖNTIIVISTELMÄ
Tekijä: Sini Pessala
Työn nimi:Linkitettyjen kevytontologioiden muutosten
kuvaaminen
Päiväys: 9. huhtikuuta 2015 Sivumäärä: vi + 76
Professuuri: Mediatekniikka Koodi: T-75
Valvoja: Professori Eero Hyvönen
Ohjaaja: Diplomi-insinööri Matias FrosterusFilosofian maisteri
Jouni Tuominen
Ontologioiden avulla pyritään mallintamaan tiettyä alaa
määrittelemällä kysei-seen alaan kuuluvia käsitteitä ja
näiden välisiä yhteyksiä. Näitä käsitteitä
voidaankäyttää alaa käsittelevän aineiston annotointiin.
Lisäksi ontologioita voidaan lin-kittää toisiin ontologioihin,
jolloin päästään hyödyntämään muualla tehtyä
työtä.Ontologioita joudutaan luonnollisesti päivittämään, kun
uusia käsitteitä tai muu-ta muutoksia tulee alalle. Tällöin
myös kyseiseen ontologiaan linkittyneitä onto-logioita voi joutua
muuttamaan, jotta linkittyneet ontologiat pysyvät
keskenäänkonsistentteina.
Tässä työssä luotiin mutu-työkalu auttamaan
ontologiakehittäjää edellä kuvatus-sa muutostilanteessa.
Työkalu välittää muutokset ontologiakehittäjälle,
lajitteleemuutokset muutoksen tyypin mukaan sekä esittää nämä
muutokset linkitetynontologian kehittäjälle. Tieteellisenä
tuloksena työkalu sisältää algoritmin, jokapyrkii ennustamaan,
milloin toisessa ontologiassa tapahtunut muutos aiheuttaamuutoksen
kehittäjän ontologiaan. Työkalun tavoitteena on helpottaa
linkitetynontologian päivitystä varsinkin suurilla
muutosmäärillä.
Työkalun luomia muutoslistoja sekä muutosten lajittelun
toimivuutta testattiinontologiakehittäjillä todellisessa
käyttötilanteessa. Työn tuloksena oli, että
lajit-teluheuristiikka toimi aineistossa hyvin käsitteiden
ominaisuuksien muutoksissaja auttaisi täten priorisoimaan
läpikäytäviä muutoksia ontologiaa päivitettäessä.
Asiasanat: linkitetyt ontologiat, erikoisontologiat, muutosten
visualisoin-ti, muutosten luokittelu, ontologioiden kehitys,
ontologioidenylläpito, tesaurukset, semanttinen web
Kieli: suomi
ii
-
Aalto UniversitySchool of ScienceDegree Programme of Computer
Science and Engineering
ABSTRACT OFMASTER’S THESIS
Author: Sini Pessala
Title:Visualising Changes in a System of Linked Lightweight
Ontologies
Date: April 9, 2015 Pages: vi + 76
Professorship: Media Technology Code: T-75
Supervisor: Professor Eero Hyvönen
Instructor: Matias Frosterus M.Sc. (Tech.)Jouni Tuominen
M.Sc.
Ontologies aim to model a field by listing concepts and their
relationships in thefield. These concepts are then used in
annotating data regarding the field. Inaddition, ontologies can be
linked to other ontologies, thus utilising the work andknowledge of
other ontology developers. Naturally, ontologies need to evolve
dueto the changes and advances of the field. In this case, also
other ontologies linkedto the ontology might require updates to
ensure the consistency of the ontologies.
In this work, I created a tool for assisting the ontology
developer in the abovedescribed update. The tool was named mutu and
it conveys the changes tothe ontology developer, classifies the
changes by their type and visualises thechanges for the developer.
As a scientific contribution, this work introduces analgorithm for
classifying changes by their priority. The algorithm aims to
predictwhich changes in the related ontology will cause changes in
the ontology of thedeveloper. The aim of the tool is to aid in
updates with a large amount of changes.
The created change lists and the performance of the change
classification weretested in a real-life update task. The outcome
of the evaluation was that thepriority classification performance
was good with the changes of property values,thus being an aid in
prioritising changes in updating ontologies.
Keywords: linked ontologies, domain ontologies, change
visualisation,change classification, ontology maintenance, ontology
update,thesauri, Semantic Web
Language: Finnish
iii
-
Kiitokset
Tämä diplomityö on tehty suurimmalta osin Aalto-yliopiston ja
Helsingin yli-opiston yhteisessä Semanttisen laskennan
tutkimusryhmässä osana FinnONTO2-hanketta.
Haluan kiittää professori Eero Hyvöstä työni valvomisesta.
Kiitokset kuuluvatmyös työni ohjaajille Matias Frosterukselle ja
Jouni Tuomiselle aina käytettävänäolemisesta työni ohjaamiseen
ja tukemiseen mitä mielikuvituksellisimmin tavoin.
Kiitokset ansaitsee myös Osma Suominen, joka ohjelmoi
ontorip-työkalun työtävarten, sekä Katri Seppälä, jonka
kanssa hahmottelimme mutuun tarvittavia omi-naisuuksia.
Suurkiitokset kuuluvat mutu-työkalun testikäyttäjille. Samaan
soppaan pääseejälleen käsiksi, kun mutusta ilmestyy seuraava
versio!
Lisäksi tahdon kiittää muita Semanttisen laskennan
tutkimusryhmäläisiä hetkistä,jotka liittyivät diplomityöhöni
enemmän tai usein vähemmän. Kiitokset lähtevätmyös
Finto-palvelun tiimille, joidenka kanssa työskennellessäni työni
aihe on sy-ventynyt ja pölyttynyt kirjastomaailman ajatuksilla.
Lopuksi kiitän vielä MattiNelimarkkaa diplomityöni
loppurutistuksessa tukemisesta ja motivoinnista.
Nummela, 9. huhtikuuta 2015
Sini Pessala
iv
-
Sisältö
1 Johdanto 1
2 Linkitetyt ontologiat 4
2.1 Ontologioiden eroja . . . . . . . . . . . . . . . . . . . .
. . . . . . . 5
2.2 Ontologioiden tekninen toteutus . . . . . . . . . . . . . .
. . . . . . 9
2.3 Ontologioiden linkittäminen ja yhdistely . . . . . . . . .
. . . . . . 10
3 Linkitettyjen ontologioiden päivittäminen 15
3.1 Ontologioiden muutokset . . . . . . . . . . . . . . . . . .
. . . . . . 15
3.2 Ontologioiden kehittäminen . . . . . . . . . . . . . . . .
. . . . . . 18
4 Menetelmä 25
4.1 Aikaisemmassa tutkimuksessa sivuun jääneitä aiheita . . .
. . . . . 25
4.2 Menetelmä ontologioiden suurten muutosmäärien
esittämiseen . . . 27
5 MUTU-muutostentunnistustyökalu 30
5.1 MUTU-työkalun käyttäminen . . . . . . . . . . . . . . . .
. . . . . 30
5.2 Muutostyypit ja muutosten tärkeys . . . . . . . . . . . . .
. . . . . 34
5.3 Muutosten visualisointitavat . . . . . . . . . . . . . . . .
. . . . . . 36
5.4 MUTU päivityksen osana . . . . . . . . . . . . . . . . . .
. . . . . 41
6 MUTUn suoriutuminen 44
6.1 Testikäyttäjät ja erikoisontologiat . . . . . . . . . . .
. . . . . . . . 44
6.2 Tulokset . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . 47
v
-
7 Yhteenveto ja lopputulokset 56
7.1 Tutkimuskysymyksiin vastaaminen . . . . . . . . . . . . . .
. . . . 56
7.2 MUTU-työkalun kehityskohteita . . . . . . . . . . . . . . .
. . . . . 57
7.3 Jatkotutkimusaiheita . . . . . . . . . . . . . . . . . . . .
. . . . . . 58
LIITTEET 66
A Loppukysely 67
B Loppuhaastattelun runko 72
C Kiinnostavat muutokset -taulukko 74
D Muutosmäärät-taulukko 75
E Erikoisontologiakehittäjien tekemät muutokset -taulukko
76
vi
-
Luku 1
Johdanto
Luovimme päivittäin suurissa tietomassoissa etsien ja
selaillen aineistoja. Modernithakukoneet löytävät helposti hakua
vastaavia tekstimuotoisia asiadokumentteja,mutta
ei-tekstipohjaisten aineistojen, kuten multimedian, äänitteiden
tai museoe-sineiden, hakujärjestelmät eivät ole yhtä
kehittyneitä [53].
Näiden hankalasti haettavien aineistojen löytämistä voi
parantaa lisäämällä me-tadataa hakukoneiden
hyödynnettävässä muodossa. Esimerkiksi kirjaan voidaanliittää
sen käsittelemät teemat tai museoesineestä voidaan ilmoittaa
käytetty ma-teriaali. Jotta metadata olisi yhtenäistä,
käytetään aineiston annotointiin alankäsitteitä kuvaavia
sanaston kaltaisia malleja, kuten asiasanastoja [17], tesauruk-sia
[17] tai kevytontologioita (engl. lightweight ontology) [15].
Käsitepohjaisia ke-vytontologioita on taas alettu ottaa
käyttöön Suomen muistiorganisaatioissa vastaviimeisen kymmenen
vuoden aikana.
Jotta ontologiat tukisivat aineiston hakemista mahdollisimman
hyvin, tulee niidenvastata aineiston annotoijan tarpeita sekä olla
ajantasaisia. Tämä tarkoittaa, ettäontologioita ei luoda
kerralla valmiiksi, vaan niitä täytyy kehittää ja
päivittää.Ontologian kehittäjänä tulisi olla kyseisen
aihealueen asiantuntija, jotta ontolo-gian rakenne ja käsitteiden
väliset suhteet ovat muodostettu erikoisalan
tiedonperusteella.
Annotointiin tarkoitettujen ontologioiden koko vaihtelee
tuhansista kymmeniintuhansiin käsitteisiin riippuen ontologian
aihepiiristä. Laajimpia näistä ontolo-gioista kehitetään
useamman henkilön voimin, joko samassa tai erillisissä
ontolo-gioissa. Erillisissä ontologioissa kehitettäessä on
mahdollista olla yksi laaja, yleisiäkäsitteitä sisältävä
yleisontologia, jota laajentaa siihen linkitetty
erikoisontologioi-den joukko. Tällaisia yleisontologioita ovat
esimerkiksi SUMO [46] ja KOKO [16].
Ontologiaa päivitettäessä voivat muiden alojen tai
yleiskäsitteiden muutokset vai-
1
-
LUKU 1. JOHDANTO 2
kuttaa erikoisalan käsitteistöön. Läheisesti yhteistyötä
tekevät ontologiakehittäjätvoivat tiedottaa muutoksista
toisilleen suullisesti, kirjallisesti tai selaamalla onto-logian
muutoslokia. Mikäli kehitystä tehdään fyysisesti eri paikoissa
tai organisaa-tioissa, voi tiedonkulku olla hankalampaa, varsinkin
mikäli erikoisalan ontologianpäivittäminen ei ole
säännöllistä. Organisaation resurssien mukaan vaihteleva
kehi-tys voi johtaa tilanteeseen, jossa katkonaisen kehityksen
takia myös muuttuneidenkäsitteiden määrä voi olla suuri, eikä
kunnollisia välineitä muutoksista tiedotta-miseen ole.
Tämä diplomityö keskittyy tarkastelemaan, miten ontologioiden
muutoksia voivälittää ontologiakehittäjille, joiden ontologia
on linkittynyt muuttuneeseen on-tologiaan. Työssä keskitytään
erityisesti yleisontologian muutosten
välittämiseenerikoisontologian kehittäjille, mutta menetelmä on
sovellettavissa myös suuriin yk-sittäisiin ontologioihin, joiden
kehittäjillä on vastuullaan tietyn alan käsitteet.
Tässä diplomityössä keskitytään seuraavaan
tutkimuskysymykseen ja sen osaon-gelmiin:
Miten kevytontologioita kehittävien
erikoisontologiakehittäjien päivitystyötä voi-daan tukea, kun
yleisontologian muutosmäärät ovat suuria?
• Voidaanko yleisontologian muutoksista erotella automaattisesti
sellaiset, jot-ka aiheuttavat muutoksia erikoisontologiassa?
• Onko mahdollista käydä läpi nämä muutoskategoriat
jossakin tietyssä jär-jestyksessä?
Työssä keskitytään vain RDFS- ja SKOS-mallinnuskielillä
esitettävissä oleviin ke-vytontologioihin. Työn ulkopuolelle
rajautuvat raskasontologiat, ontologioiden va-lidointi [10, 69],
muutosten levittäminen (engl. change propagation) [6] sekä
ins-tanssidatan muutoksissa validina säilyttäminen [48].
Tutkimuskysymyksiin vastattiin luomalla prototyyppityökalu
muutosten esittämi-seen. Tämän prototyypin käyttöä arvioitiin
todellisessa ontologiapäivitystilantees-sa.
Diplomityön sisältö on seuraavanlainen: Luvussa 2 tutustutaan
tarkemmin onto-logioihin sekä näiden välisiin linkkeihin.
Muutoksiin ja kehitykseen linkitetyissäontologioissa syvennytään
luvussa 3. Luku 4 listaa aikaisemmassa tutkimuksessasivuun
jääneitä aiheita sekä esittelee menetelmän, jota on käytetty
luvussa 5 esi-teltävän muutostyökalun pohjana. Luvussa 6
esitellään arviointi työkalun käytöstäpäivitystilanteessa.
Luvussa 7 tarkastellaan vastauksia tutkimuskysymyksiin
sekähahmotellaan tulevaisuuden tutkimus- ja kehityssuuntia.
-
LUKU 1. JOHDANTO 3
Tämä diplomityö perustuu osittain mutu-työkalusta
aikaisemmin julkaistuun ar-tikeliin [51].
-
Luku 2
Linkitetyt ontologiat
Termi ontologia on alun perin ollut käytössä filosofiassa
merkitsemässä oppia to-dellisuudesta. Ontologiatutkimus voimistui
erityisesti 80- ja 90-luvuilla, jolloin te-koäly-,
ohjelmistokehitys- ja tietokantatutkimus huomasivat toisistaan
tietämät-tään tarvitsevansa tapoja korkeamman tason
konseptuaalisia malleja. Nämä alatomaksuivat ontologia-termin
merkitsemään esityksiä käsitteistä ja niiden
välisistäsuhteista. Gruber [21] määritteli ontologian olevan
”tietyn aihealueen käsitteistöneksplisiittinen malli” (suom.
[63]). Tämä määritelmä on hyvin laaja, eikä juuri-kaan ota
kantaa toteutustapaan, jotta se olisi yhteensopiva näiden kolmen
alannäkemyksien kanssa. [57]
Muita määritelmiä ja selityksiä ovat tarjonneet muun muassa
Struder [61] sekäGuarino ja Giaretta [18]. Uschold ja Jasper [27]
määrittelivät ontologian yleisem-min näin:
An ontology may take a variety of forms, but it will
necessarilyinclude a vocabulary of terms and some specification of
their mea-ning. This includes definitions and an indication of how
concepts areinter-related which collectively impose a structure on
the domain andconstrain the possible interpretations of terms.
Heidän määritelmänsä pyrkii kokoamaan yhteen useilla
tieteenaloilla käytetyt on-tologiat tai ontologian kaltaiset
tiedonesitystavat. Yksi keskeisistä ontologioidentarkoituksista on
toimia yhteisenä ”sanastona”useamman toimijan kesken.
Tämätarkoittaa, että hyödynnettävyyden takia ontologioiden
tulisi olla yhteisesti sovit-tuja, koneluettavia formaaleja
esityksiä. Tavoitteena on ontologioiden
käyttäminenkommunikaation tehostamisessa sekä koneiden että
ihmisten välillä toteuttaentäten Semanttisen Webin periaatteita
[5].
4
-
LUKU 2. LINKITETYT ONTOLOGIAT 5
Sovelluskohde vaikuttaa vahvasti siihen millaisia tarpeita
ontologiaa kohtaan on.Käyttötapa määrää paljonko käsitteitä
tarvitaan ja kuinka paljon rakennetta kä-sitteisiin ja niiden
välille tarvitaan. Gómez-Pérez ja kumppanit listaavat
seuraaviakäyttökohteita ontologioille [20, s. 8]
• luonnollisen kielen käsittely
• tietämyksen hallinta
• verkkokauppa
• älykäs tietojen yhdistely
• semanttinen web
Tyypillisesti semanttisessa webissä toimivat agentit
tarvitsevat päättelyyn paljonaksioomia ja rajoituksia
sisältäviä ontologioita [24] kun taas tietämyksenhallinnas-sa
on käytetty pääosin rakenteeltaan kevyempiä tesauruksia [25].
Seuraava alilukuesitteleekin erilaisia ontologioita sekä näiden
luokittelutapoja.
2.1 Ontologioiden eroja
Ontologioita tehdään erilaisilla aloilla, kuten biologiassa,
kirjastoissa ja tekoäly-tutkimuksessa, joten ontologioiden
näkökulmat että käyttökohteet voivat erotatoisistaan
huomattavasti. Aikaisemmassa tutkimuksessa ontologioita onkin
luoki-teltu monin eri tavoin [37, 45, 65]. Seuraavaksi esittelen
kaksi erilaista tapaa jao-tella ontologioita: Van Heijstin ja
kumppanien [65] kahden näkökulman jaottelukäsitteistön
rakenteiden sekä kohteen mukaan. Tämän jälkeen esittelen
Lassilanja McGuinnessin [37] ontologian sisäisen rakenteen
rikkauteen perustuvan jatku-mon. On hyvä huomata, että Van
Heijstin sekä Lassilan ja McGuinnessin tavatjaotella ontologioita
eivät ole toisiaan poissulkevia, vaan ne täydentävät
toisiaan.Van Heijstin esitystapa keskittyy enemmän ontologioihin
käyttötarkoituksen pe-rusteella ja Lassila ja McGuinness
tarkastelevat ontologioiden rakennetta.
Van Heijstin ja kumppanien ontologiakategoriat
Jaottelu käsitteistön tyypin ja rakenteen mukaan kuvan 2.1
mukaisesti:
• Termiontologiat (engl. Terminological Ontologies) ovat
sanaston tyyppisiämalleja, jotka määrittävät tietyn alan
termit.
-
LUKU 2. LINKITETYT ONTOLOGIAT 6
Kuva 2.1: Van Heijstin ja kumppaneiden ontologiakategoriat [65]
mukailtunaGómez-Pérezin ja kumppanien kuvasta [20]
• Informaatio-ontologiat (engl. Information Ontologies)
määrittävät skee-mamaisesti mallin tiedon tallennukseen
tietokantaan.
• Tiedonmallinnusontologiat (engl. Knowledge modelling
Ontologies) pyr-kivät mallintamaan aihealuettaan. Tämän johdosta
tiedonmallinnusontolo-giat ovat yleensä rakenteeltaan rikkaampia
kuin informaatio-ontologiat.
Jaottelu käsitteistön kohteen mukaan:
• Sovellusontologiat (engl. Application Ontologies) ovat
tiettyä sovellustavarten luotuja ontologioita. Nämä ovat
yleensä kokoelmia erikois- ja yleison-tologioiden käsitteistä
sekä sovelluskohtaisista laajennuksista. Sovellusonto-logiat
eivät ole pääsääntöisesti uudelleenkäytettävissä muissa
sovelluksissa.
• Erikoisontologiat (engl. Domain Ontologies) sisältävät
tietyn alan käsit-teistön.
• Yleisontologiat (engl. Generic Ontologies) sisältävät
yleisiä käsitteitä, joi-ta halutaan hyödyntää useammilla
aloilla [65]. Yleisontologiat voivat sisältääjopa kymmeniä
tuhansia käsitteitä ja erikoisontologiat voivat osaltaan
laa-jentaa yleisontologioiden käsitteistöä.
-
LUKU 2. LINKITETYT ONTOLOGIAT 7
Kuva 2.2: Lassilan ja McGuinnessin ontologiajatkumo [37]
mukailtuna Gómez-Pérezin ja kumppanien kuvasta [20]
• Yläontologiat (engl. Upper Ontology), joita aiemmin
kutsuttiin englanniksitermillä Representation Ontologies, kuvaavat
neutraalilla tavalla yleisimmäntason käsitteistöä. Yleis- ja
erikoisontologiat pohjautuvat yläontologioidenluomille
käsitejaoille [65]. Yläontologiat koostuvat tyypillisesti
muutamistakymmenistä käsitteistä, joiden tavoitteena on
kategorisoida muiden ontolo-gioiden käsitteet erillisiin
kategorioihin.
Lassilan ja McGuinnessin ontologiajatkumo
Lassila ja McGuinness [37] jaottelevat ontologiat niiden
sisäisten rakenteen rikkau-den mukaan ilmenevänä jatkumona
(kuvassa 2.2).
Heidän jatkumonsa sisältää seuraavat ontologioiden rikkaus-
ja tarkkuustasot:
• Kontrolloidut sanastot (engl. Controlled vocabularies) eli
termilistat
• Asiasanastot(engl. Glossary), joissa on termien listaamisen
lisäksi niidenmäärittelyt luonnollisella kielellä.
• Tesaurukset (engl. Thesauri) sisältävät termien välisiä
yhteyksiä, muttaeivät välttämättä sisällä eksplisiittistä
hierarkiaa.
• Vapaamuotoinen hierarkia (engl. Informal is-a), jossa
käsitteillä on ylä-käsite, mutta hierarkia ei noudattele
formaalia luokkahierarkiaa.
• Formaali luokkahierarkia (engl. Formal is-a), jossa käsitteet
ovat yläkä-sitteensä aitoja alakäsitteitä, mikä mahdollistaa
ominaisuuksien periyttämi-sen yläluokilta.
• Varsinaiset instanssit (engl. Formal instance), jotka
formaalin luokkahie-rarkian lisäksi sisältävät aihealueen
instansseja.
-
LUKU 2. LINKITETYT ONTOLOGIAT 8
• Kehykset (ominaisuudet) (engl. Frames (properties)), jonka
tyyppisessäontologiassa käsitteille voi määritellä
ominaisuuksia, jotka periytyvät käsit-teen alakäsitteille ja
instansseille.
• Arvorajoitukset (engl. Value Restrictions), jotka voivat
rajoittaa instans-sien ominaisuuksien arvoja.
• Yleiset loogiset rajoitukset (engl. General Logical
Constraints), jossa on-tologiakehittäjä voi määritellä
rajoitteita ensimmäisen kertaluvun logiikkaakäyttäen.
• Erillisyys, käänteisyys, osasuhde (engl. Disjointness,
Inverse, Part-Of )ja muut ilmaisuvoimaisemmat ominaisuudet ja
menetelmät.
Lassilan ja McGuinnessin jatkumo perusteella viivan vasemmalla
puolella ole-via taksonomian omaisia ontologioita voidaan kutsua
kevytontologioiksi (engl.lightweight ontology)[15] ja oikealla
puolella olevia aksioomia ja rajoituksia sisäl-täviä
ontologioita raskasontologioiksi (engl. heavyweight ontology)[20,
s. 8]. Giunc-higlia [19] lisää vielä Lassilan ja McGuinnessin
kevytontologian määritelmään vaa-timuksen yhtenäisestä,
puumuotoisesta käsitehierarkiasta.
Kun Lassilan ja McGuinnessin vuonna 2001 luomaa jatkumoa
tarkastellaan nyky-ontologioiden ja ontologiakielien valossa,
voidaan huomata että raskasontologioi-den ilmaisuskaala loppuu
kesken. Esimerkiksi vuonna 2004 julkaistun OWL-ontolo-giakielen
avulla pystyy ilmaisemaan sekä erillisyyttä että
käänteisyyttä. Jatkumoatulisikin päivittää erittelemään
myös nykyistä raskasontologioiden kirjoa.
Toisin kuin Lassilan ja McGuinnessin jatkumo, ISO 25964-2
-standardi [26] näkee,että ontologian ja tesauruksen eroja
ovat:
• Ontologioissa instanssit ja luokat on erotettu toisistaan
selvästi, kun taastesauruksissa tämä ei ole
välttämätöntä
• Tesaurukset on tarkoitettu ihmisten käytettäväksi, kun taas
ontologiat ontehty koneluettaviksi. Tämän takia tesauruksissa on
tärkeää olla listattunasaman termin muita muotoja, kun taas
ontologioissa voi usein riittää vainoletusnimike (engl.
prefLabel), sillä keskitytään päättelyyn.
• Tesauruksissa on tärkeää erotella termin merkitykset
toisistaan, esim. ”aura(maatalousväline)” ja ”aura (oire)”.
Ontologioissa termitason disambiguoitiei ole niin tärkeää,
sillä rakenne ei ole tarkoitettu käyttäjien nähtäväksi.
• Ontologiassa on tärkeää esittää käsitteiden väliset
suhteet eksplisiittisesti,kun taas tesauruksessa tarkoitus on tukea
ihmistä sopivan termin etsimisessä.
-
LUKU 2. LINKITETYT ONTOLOGIAT 9
Ontologioissa halutaan esimerkiksi erotella hierarkkiset ja
osa-kokonaisuus-suhteet toisistaan, kun tesauruksissa riittää
laajempi termi -suhde.
Kuten ylläolevia ontologioiden luokitteluja tarkastellessa voi
huomata, että onto-logioita voi jaotella useilla eri tavoilla
näkökannasta riippuen. Lisäksi ontologia-käsitteen merkitys
vaihtelee tutkimuksesta toiseen, kuten huomattiin
verratessaLassilan ja McGuinnesin jatkumoa ISO 25964-2
-standardiin. Tämän merkityksenvaihtelevuuden takia esitän
seuraavaksi, miten tässä työssä käytetään
ontologia-termiä.
Ontologia-termin määritelmä tässä työssä
Tässä työssä:
1. Ontologia on tesauruksenkaltainen kevytontologia sisältäen
tuhansia käsit-teitä, mutta suhteessa vähän
ominaisuustyyppejä. Ontologian sovelluskoh-teena on tiedonhaun
tukeminen.
2. Ontologian käsitteellä tulee aina olla määriteltynä
yläkäsite ja hierarkia pe-rustuu luokkahierarkiaan.
3. Käsitteellä on yksilöivä ja päivityksissä muuttumaton
URI-tunniste ja mah-dollisuus olla nimikkeitä (engl. label)
useammalla kielellä.
On huomattava, että myös tesaurus voi täyttää yllä olevat
vaatimukset, muttaontologialla näiden täytyy aina täyttyä.
2.2 Ontologioiden tekninen toteutus
Ontologioiden teknisen toteutuksen pohjana on Resource
Description Framework -tietomalli (RDF) [38]. RDF perustuu
subjekti-predikaatti-objekti-kolmikoihin (engl.triple). Subjekti on
kuvailtava resurssi, predikaatti kertoo millainen
ominaisuussubjektiin on liittyneenä ja objekti voi olla joko
toinen resurssi tai literaaliarvo.Nämä kolmikot muodostavat
suunnatun verkon kuvaten sen solmuja ja kaaria.Keskeinen asia
käsiteresurssien verkon luomisessa on käsitteiden yksilölliset
URI-tunnisteet (engl. Uniform Resource Identifier) [4].
URI-tunnisteet mahdollistavattietojen yhdistelyn, sillä
yksilöllisiä tunnisteita tarvitaan käsitteeseen
käsitteeseenviittaamisen, linkittämisen ja kuvauksen
laajentamisen muissa tietolähteissä.
-
LUKU 2. LINKITETYT ONTOLOGIAT 10
RDF itsessään sisältää vain tarvittavat elementit
verkkomaisen datan esittämiseen.RDF Schema (eng. RDFS ) [42]
laajentaa RDF:ää lisäämällä siihen luokkia jaominaisuuksia,
jotka mahdollistavat käsite- ja ominaisuushierarkioiden
luomisensekä rajoitteet. Koska RDF ja RDFS antavat vain mallin
verkkomuotoisen datanesittämiseen, tarvitaan lisäksi
RDF-muotoiseen dataan pohjautuvia tiedonesitys-kieliä ja
-standardeja. Esimerkkinä näistä ovat SKOS (engl. Simple
Knowledge Or-ganization System) [43] sekä OWL (engl. Web Ontology
Language) [66]. SKOS onsuunniteltu sanastojen, luokitusten sekä
kevytontologioiden esittämiseen, minkätakia siinä on valmiiksi
ominaisuuksia ja luokkia käsitteiden ja nimikkeiden
välistensuhteiden ilmaisemiseen, kuten skos:prefLabel- tai
skos:closeMatch-ominaisuudet.OWL puolestaan on tarkoitettu
raskaammille ontologioille. Sillä voi ilmaista ra-joituksia ja
sääntöjä, mikä mahdollistaa logiikkaa hyödyntävän
päättelyn.
RDF itsessään ei ole tiedostomuoto, vaan tietomalli
verkkomuotoisen datan e-sittämiseen. RDF-muotoisen datan
tallennukseen onkin olemassa useita seriali-sointimuotoja.
Aikaisemmin yleisin RDF-muotoisen datan serialisointimuoto
oliRFD/XML [68], jossa RDF-graafi tallennettiin yleisesti
käytössä olleessa XML-formaatissa. XML on yleisformaatti, joten
se ei ole optimoitu RDF-muotoisen da-tan esittämiseen. Tämän
takia RDF/XML-muotoisen datan lukeminen ja kirjoitta-minen on
ihmiselle työlästä sen toisteisuuden vuoksi. Turtle-formaatti
[3] sitä vas-toin suunniteltiin vartavasten RDF-muotoista dataa
varten. Se on helposti ihmis-luettavaa ja se on myös
tiedostokooltaan vastaava RDF/XML-tiedostoa huomatta-vasti
pienempi. Lisäksi tuoreimpana serialisointimuotona on JSON-LD
[36], missäRDF-data serialisoidaan nykyisin web-kehityksessä
suosittuun JSON-formaattiin.
2.3 Ontologioiden linkittäminen ja yhdistely
Ontologioiden luominen on työlästä ja aikaa vievää. Usein
onkin helpompaa hyö-dyntää tai laajentaa jo olemassa olevia
ontologioita kuin luoda täysin uusi ontolo-gia. Olemassa olevia
ontologioita ja muita tietolähteitä ei tarvitse kopioida
omaanontologiaansa, vaan niihin voi viitata linkkien avulla. Tämä
mahdollistaa toisillaontologioilla annotoidun datan hyödyntämisen
muissa sovelluksissa. Lisäksi lin-kittämisen etuna on se, että
kehittäjät eivät tee päällekkäistä työtä
käsitteidenpäivittämiseen, vaan kehitysresurssit voidaan
käyttää omien erikoiskäsitteiden yl-läpitoon.
Ontologioita voidaan yhdistää tai liittää toisiinsa
RDF-tietomallin avulla. RDF-tietomalli perustuu kolmikoihin, joten
ontologioiden liityntäkohta on sellainen kol-mikko, jossa subjekti
ja objekti ovat eri ontologioista Tällöin subjektin ja
objektinnimiavaruudet eivät ole samat [7]. Tavoitteena on saada
mahdollisimman paljon
-
LUKU 2. LINKITETYT ONTOLOGIAT 11
yhtymäkohtia ontologioiden välille. Mitä enemmän näitä
yhteyksiä eri käsitteidenvälillä on, sitä paremmin pystytään
ymmärtämään miten ontologioiden käsitteetliittyvät toisiinsa.
Periaatteessa ontologioita yhdistävä ominaisuus voi olla
mikätahansa ja ontologioiden välillä voi olla useita
erityyppisiä linkitettäviä ominai-suuksia. Tästä yleisimpänä
esimerkkinä ontologioiden välisiin linkkeihin on
onrdf:type-ominaisuus, jonka avulla usein määritellään
käsitteelle yleinen tyyppi, ku-ten skos:Concept. Tässä työssä
ontologioiden linkittämisellä tarkoitetaan kuitenkinkahden
ontologian välisiä yhteyksiä, jossa yhdistävä ominaisuus on
hierarkkinentai ekvivalenssiyhteys.
Myös ontologioiden modularisoinnissa alalla keskitytään
ontologioiden välisiin yh-teyksiin. Modularisoinnissa on kaksi
päätapaa: suuresta ontologiasta pienempienmoduleiden eristäminen
sekä laajan ontologian muodostaminen pienemmistä
on-tologiamoduuleista.[55] Ontologioiden modularisointi kuitenkin
on pääasiassa kes-kittynyt automaattisiin menetelmiin moduleiden
eristämisessä, yhdistelyssä sekävalidoinnissa usein logiikkaa
sisältävien ontologioiden kanssa. Tässä työssä kes-kitytään
kevytontologioiden kehittäjiin, joten modularisointi alana
rajautuu työnulkopuolelle.
Linkitettyjen ontologioiden väliset yhteydet
Ontologioiden välisten yhteyksien sanallinen kuvaaminen on
rikasta sekä englan-niksi että suomeksi. Englanniksi voidaan
puhua termeistä ontology mapping ja on-tology alignment, joissa
ontologiat itsessään eivät muutu linkityksiä lisätessä,
sekäontology reconciliation, jossa ontologioita voidaan muokata
linkityksiä etsittäessäja lisätessä [11]. Lisäksi myös
alignment-termiä vastaava ontology linking -termiäon esiintynyt
kirjallisuudessa. Suomessa termejä peilaaminen, siltaaminen
sekälinkittäminen voidaan käyttää sekä samaa aihealuetta
olevien ontologioiden ettäylä-erikoisontologiaparien välisiin
suhteisiin. Ripustaminen-termiä voi puolestaankäyttää vain
kuvailtaessa erikoisontologian suhdetta yläontologiaansa
ajateltaessaontologiaa tietojenkäsittelyn puumaisena
tietorakenteena.
Hameed ja kumppanit [23] ovat listanneet kolme rakennemallia
ontologioiden lin-kittämiseen (kuvassa 2.3).
Ontologiaparin väliset yhteydetLinkattavien ontologien välille
on luotu suora linkitys ja ne ovat ontologia-kehittäjän
hallittavissa. Menetelmä on joustava, mutta ylläpidettävien
linki-tysten määrä kasvaa ja voi viedä ylimääräisiä
resursseja.
Ontologioiden yhteydet yhteiseen ontologiaanOntologiat on
linkitetty yhteen yhteiseen ontologiaan, minkä ansiosta eri
on-
-
LUKU 2. LINKITETYT ONTOLOGIAT 12
Kuva 2.3: Hameedin ja kumppanien [23] rakennemallit
ontologioiden lin-kittämiseen
-
LUKU 2. LINKITETYT ONTOLOGIAT 13
tologioissa olevien käsitteiden välinen yhteys on tiedossa
ilman erillisen linki-tyksen tekemistä. Varjopuolena
menetelmässä on yhteisen ontologian ylläpitoja se, että linkit
muihin ontologioihin eivät ole kehittäjän hallinnassa.
Yhteisten ontologioiden yhteydet toisiinsaYhteiset ontologiat
voi myös linkata toisiinsa, jolloin yhteydellisten ontolo-gioiden
määrä kasvaa entisestään yhdellä ontologiaparin välisellä
linkityk-sellä.
Vastaava jako on myös esillä ISO 25964-2 -standardissa [26],
jossa lisäksi maini-taan, että linkkauksilla on suunta. Tämä ei
niinkään tule esiin tehdessä linkityk-siä yhdestä
käsitteestä toiseen, vaan tilanteissa, joissa yhtäläisyyden
esittämiseentarvitaan useampia käsitteitä sekä logiikkaa.
Tässä työssä kuitenkin pitäydytäänlähtökohdassa, että
ontologioiden väliset linkit ovat kahden yksittäisen
käsitteenvälillä.
On hyvä huomata, että Hameedin ja kumppanien tai ISO 25964-2
-standardin ra-kennemallit eivät ota kantaa siihen, mikä
ontologioiden hierarkioiden suhde toisiin-sa on. Sunagawa ja
kumppanit [62] esittelevät ontologioiden mahdolliset
suhteettoisiinsa:
Hierarkkinen suhdeOntologioilla on hierarkkinen suhde, jos on
olemassa kolmikko, jossa predi-kaatti on hierarkkinen suhde ja
kolmikon subjekti ja objekti ovat eri ontolo-gioista. Tällöin
ontologioita kutsutaan yläontologiasi ja alaontologiaksi.
ViittaussuhdeOntologioilla on viittaussuhde, jos on olemassa
kolmikko, jossa subjekti jaobjekti ovat eri ontologioista.
Tällöin puhutaan subjektin ontologiaa kutsu-taan
lähdeontologiaksi ja objektin kohdeontologiasta.
On hyvä huomata, että hierarkkinen suhde on erikoistapaus
geneerisemmästä viit-taussuhteesta. Teoriassa ontologioiden
väliset linkit voi toteuttaa käyttäen mitätahansa ominaisuutta,
mutta kuitenkin käytännössä linkkaukseen käytetyt
omi-naisuudet, varsinkin tesauruksissa, ovat ekvivalenssiyhteys,
hierarkkinen sekä as-sosiatiivinen suhde [26]. Usein selkeyden ja
teknisen toteutuksen yksinkertaisuu-den vuoksi linkitykset
saatetaan tehdään vain ekvivalenssiyhteyttä käyttäen.
Esi-merkkinä hierarkkisesta ontologiasuhteesta on muun muassa
Yleinen suomalainenontologia YSO1 [54] erikoisontologioineen2 sekä
SUMO [46] erikoisontologioineen,
1http://www.seco.tkk.fi/ontologies/yso/2http://www.seco.tkk.fi/ontologies/
http://www.seco.tkk.fi/ontologies/yso/http://www.seco.tkk.fi/ontologies/
-
LUKU 2. LINKITETYT ONTOLOGIAT 14
kuten [46, 56, 58]. owl:sameA-suhde on käytössä esimerkiksi
Freebasen3 ja DBpe-dian4 [39] välillä kun taas
closeMatch-suhdetta on käytetty Kongressin kirjaston5,Saksan6
sekä Ranskan7 kansalliskirjastojen auktoriteettitietokantojen
väliseen lin-kitykseen.
Lopuksi esittelen ontologioiden välisten linkkien
tallentamisvaihtoehtoja. Tesau-russtandardissa ISO 25964-2 [26]
mainitaan, että ontologioiden linkitysten vaih-toehtoja
tallennuspaikaksi ovat säilyttäminen ja ylläpito linkityksen
lähde- taikohdeontologiassa, säilytys erillään kummastakin
ontologiasta tai samassa järjes-telmässä kuin missä lähde- ja
kohdeontologiat ovat. Tämä tarkoittaa, että ontolo-gioiden
välisiä linkityksiä voivat tehdä muutkin kuin linkitettävien
ontologioidenkehittäjät, joten kyseisten ontologioiden
kehittäjät ole välttämättä tietoisia linki-tysten
olemassaolosta. Mikäli linkityksiä ei ole julkaistu avoimesti, ei
linkityksenkohteena oleva ontologia välttämättä tiedä
linkityksistä, jolloin ei ole mahdollistahuomioida linkityksiä
ontologioiden päivityksessä.
3https://www.freebase.com/4http://dbpedia.org/5http://id.loc.gov/authorities/subjects.html6http://www.dnb.de/gnd7http://rameau.bnf.fr/
https://www.freebase.com/http://dbpedia.org/http://id.loc.gov/authorities/subjects.htmlhttp://www.dnb.de/gndhttp://rameau.bnf.fr/
-
Luku 3
Linkitettyjen ontologioiden päivit-täminen
Tässä luvussa keskitytään linkitettyjen ontologioiden
kehittämiseen ja kehittämisenaikana tehtäviin muutoksiin.
Tarkastelun kohteena ovat vain olemassa olevienontologioiden
muutokset, joten ontologioiden luominen tyhjästä ja
aikaisempialähteitä tai ontologioita hyödyntäen rajautuu työn
ulkopuolelle. Näihin voi tu-tustua muun muassa viitteissä [22,
50, 54, 67]. Luvussa tutustutaan ensin onto-logioiden päivityksiin
ja muutoksiin yleisellä tasolla. Tämän jälkeen
tarkastellaanmuutoksia konkreettisemmalla tasolla ja lopuksi
perehdytään kirjallisuuteen onto-logioiden kehittämisestä sekä
muutostyökaluista.
3.1 Ontologioiden muutokset
Ontologia voidaan luoda kerralla valmiiksi tiettyä tarkoitusta
varten. Usein on-tologiaa kuitenkin halutaan päivittää
vastaamaan muuttuviin tilanteisiin tai tar-peisiin. Klein ja Fensel
[35] ovat määritelleet, että ontologian kehitystarpeet tu-levat
joko ontologian aiheen, käsitteellistämisen tai spesifikaation
muutoksista.Flouris ja kumppanit [14] ovat lähestyneet
päivitystarvetta käytännöllisemmästänäkökulmasta listaten
muutokseen alla olevat syyt:
• maailma on muuttunut
• muutos näkökulmaan, jolla ontologian aihepiiriä
tarkastellaan
• löydetty ongelma alunperäisessä
käsitteellistämisessä
• halu lisätä uusia ominaisuuksia käyttäjätoiveiden
pohjalta
15
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 16
• aihepiiristä aikaisemmin saavuttamattomissa olleen tiedon
saaminen
Mädche ja kumppanit [41] taas listaavat syitä ontologioiden
muutokseen ohjelmis-totuotannon näkökulmasta. Ontologian
muutoksia aiheuttavat heidän mukaansa:
• käyttöympäristön muutos, esimerkiksi ontologiaan voidaan
haluta sisällyttääuuden alan käsitteistöä
• käyttäjävaatimusten muutos, esimerkiksi ontologiaa
käyttävälle sovelluksellevoi tulla uusi käyttäjäryhmä
• ontologian käyttöä tarkkailtaessa huomatut uudet
vaatimukset
Näissä kaikissa muutoslistoissa on yhteistä se, että
muutospaineen tuo joko ai-hepiirin tai käyttöympäristön muutos.
Ontologiat eivät siis eivät ole pelkästäänaihepiirinsä
kuvauksia, vaan niistä heijastuu myös niiden käyttötapa.
Koska ontologioiden muutos- ja päivitystarpeet ovat erilaisia,
ne voivat lähteä ke-hittymään erilaisiin suuntiin. Flouris ja
kumppanit [14] listaavat eri näkökulmat,joista ontologioiden
kehitystä ja muutoksia tutkimuksessa on tarkasteltu:
• ontologioiden evoluutio, versiointi (engl. ontology evolution,
versioning)
• siltaaminen, morfismi, linjaus, artikulaatio, kääntäminen
(engl. mapping,morphism, alignment, articulation, translation)
• integraatio, yhdistely (engl. integration, merging)
Ontologioiden evoluutio ja versiointi keskittyvät ratkaisemaan
ontologioiden muu-toksista ja päivityksistä johtuvia
yhteensopivuuden haasteita. Ala on kehittynyttietokantatutkimuksen
skeemaevoluutiosta ja versioinnista (engl. schema evolutionand
versioning) [48]. Tietokannoissa evoluutiolla tarkoitetaan skeeman
muutostasiten, että muutoksen aikana dataa ei häviä.
Verisoinnilla taas tarkoitetaan mah-dollisuutta kysellä dataa
skeeman eri versioiden avulla. Ontologioiden kanssa evo-luutiolla
tarkoitetaan usein ylipäätänsä muutoksia ontologiassa, kun taas
versioin-nissa ollaan kiinnostuttu alaspäin yhteensopivuudesta
sekä instanssidatan validinaja käytettävänä
säilymisestä.
Ontologioiden yhtäläisyyksien kartoittamiseen on useita
samankaltaisia termejäja aloja. Näitä ovat ontologioiden
siltaaminen, morfismi, linjaus, artikulaatio jakäännökset, jotka
keskittyvät vaihtelevan sisältöisten ja esitystapaisten
ontologioi-den välisten yhtäläisyyksien löytämiseen. Kyseessä
voi olla esimerkiksi saman alan
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 17
kaksi tai useampi ontologiaa, joiden samankaltaisuutta
yritetään kartoittaa tai eri-koisontologia, joka halutaan
linkittää yleisontologiaan. Suurin osa näistä aloista
onkiinnostunut etsimään käsitteiden välisiä yhteyksiä ja
esittämään tulokset halu-tussa muodossa, esimerkiksi ontologiaan
lisättyinä linkkeinä ontologioiden välillätai ontologiana
yhteisistä käsitteistä. Ontologioiden integraatiossa ja
yhdistelyssätavoitteena on luoda uusi yhtenäinen ontologia
hyödyntäen useampia ontologioitaja näiden välisiä
linkityksiä.
On hyvä huomata, että yllä esitellyt ontologioiden
yhtäläisyyksien alat keskit-tyvät lähes pelkästään
menetelmien kehittämiseen tai parantamiseen.
Ontologiake-hittäjien tarpeet eivät ole juurikaan esillä
ontologioiden evoluutiota käsittelevässäkirjallisuudessa.
Muutostyypit
Ontologian päivityksessä ontologiaan tehtäviä muutoksia
voidaan kategorisoidausein eri tavoin. Klein ja kumppanit [33] ovat
jakaneet ontologian muutokset kol-meen kategoriaan.
• ei-loogiset muutokset, kuten muutokset luonnollisella
kielellä esitettyihinarvoihin
• loogisten määritelmien muutokset, eli muutokset käsitteen
määrittelyyn,kuten subClassOf-ominaisuuden arvojen muutokset.
Termi on harhaanjohta-va, koska sillä tarkoitetaan käsitteen
muita kuin merkkijonoarvoihin tuleviamuutoksia eikä suinkaan
logiikkaan liittyviä muutoksia.
• tunnistemuutokset, kuten resurssien lisäykset tai poistot
Yleisempi jakoperiaate on kuitenkin Stuckenschmidtin ja Kleinin
[60] muutostenjako atomisiin (engl. atomic) sekä kompleksisiin
(engl. complex change) muutok-siin. Atomiset muutokset tunnistetaan
hyödyntämällä käytetyn ontologiakielenominaisuuksia, eikä
tietoa ontologiasta itsestään käytetä. Kompleksiset
muutoksettaas voivat hyödyntää tietoa ontologian rakenteesta tai
ne olla yhdistelmä atomi-sia ja kompleksisia muutoksia. Lisäksi
kompleksisia muutoksia voidaan käyttäämuutosten syiden tai
vaikutusten esittämiseen.
Klein ja Noy ovat useampaan otteeseen listanneet ontologioiden
muutostyyppejä.Vuonna 2003 he listasivat yli 80 muutostyyppiä
[34]. Muutostyyppejä ei oltu eri-telty tarkemmin, vaan mainittiin
näiden pohjautuvat OWL-ontologiakielen omi-naisuuksiin.
Oletettavasti muutostyypit ovat atomisia, sillä niiden tavoitteena
onmallintaa ontologioiden muutoksia. Seuraavana vuonna he
listasivat ontologioille
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 18
22 muutosoperaatiota [48], jolloin tarkastelu kohdistui siihen,
millaisissa muutok-sissa instanssidata säilyy validina. Lähes
kaikki muutostyypeistä ovat kompleksisiayhdistäen useampia
atomisia muutoksia ja tietoa ontologian rakenteesta. Lisäksimonet
muutostyypeistä ovat ominaisuuksien määritelmien muutoksia tai
muu-toksia millä käsitteillä kyseistä ominaisuutta voi
käyttää. Kumpikin näistä muu-tostyyppilistoista oli siis
tarkoitettu mallintamaan muutoksia raskasontologioissa,joiden
skeemaa tyypillisesti muutetaan ontologiaa kehittäessä.
Skeemamuutoksiaei juurikaan tehdä kevytontologioille, joten suurin
osa muutoskategorioista jäisikäyttämättä kevytontologian
muutoksia mallintaessa.
Kompleksisia muutostyyppejä ovat listanneet myös muun muassa
Stojanovic jakumppanit [59] sekä Stuckenschmidt ja Klein [60].
Stuckenschmid ja Klein määrit-telivät 120 kompleksista muutosta,
mutta mainitsevat määrän kasvavan koko ajan,sillä kompleksisia
muutoksia voi määritellä lisää. Lisäksi Klein [34]
huomauttaa,että kompleksisia muutoksia ei voi täydellisesti
tunnistaa, sillä käsitteisiin voidaantehdä muitakin muutoksia.
Tämän takia kompleksisten muutosten tunnistaminenvaatii
heuristiikkaa.
Poiketen ontologioiden muutoksen näkökulmasta,
tesaurusstandardi ISO 25964-1[25] listaa tesauruksen muutoksia
kehittäjänäkökulmasta. Muutostyypit ovat sel-västi tarkoitettu
ihmisten luettavaksi, sillä osa kuvauksista on epämääräisiä,
kutenkohta ”k) hierarkian muuttaminen”. Monet muutoksista ovat
kompleksisia muu-toksia yhdistellen useita muutoksia laajemmaksi
käsitteelliseksi muutokseksi.
3.2 Ontologioiden kehittäminen
Tässä aliluvussa perehdytään ontologioiden kehittämiseen
sekä linkitettyjen on-tologioiden kehityksen haasteisiin. Usein
ontologia tai ontologiakokonaisuus ei oletäysin yhden kehittäjän
vastuulla. Yleisempi tilanne on, että useampi kehittäjä
ke-hittää samaa ontologiaa tai toisiinsa linkittyneitä
ontologioita. Noy ja kumppanit[47] ovat listanneet seuraavia
ontologioiden yhteiskehityksen ulottuvuuksia:
Synkroninen vs. asynkroninen kehittäminenSynkronisessa
kehityksessä ontologiakehittäjät pystyvät välittömästi
näke-mään ontologiassaan muiden tekemät muutokset. Muutosten
välitön näke-minen vähentää huomattavasti päällekkäisten
muutosten tekemistä. Asynk-ronisessa kehittämisessä taas
kehittäjät tekevät itsenäisesti muutoksia on-tologian kopioon
ja nämä tehdyt muutokset lopulta yhdistetään. Koska
ke-hittäjät eivät voi nähdä toistensa tekemiä muutoksia, voi
yhdistelyssä tullapäällekkäisiä tai ristiriitaisia muutoksia.
Nämä ristiriidat tulee ratkaista on-tologioiden yhdistelyn
aikana.
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 19
Jatkuva julkaisu vs. ajoittainen arkistointi Jatkuvassa
julkaisussa ontologi-an sen hetkinen versio on julkisesti
nähtävillä. Täten ontologiasta ei ole erik-seen talletettuja ja
nimettyjä versioita. Ajoittaisessa arkistoinnissa ontolo-giasta
laitetaan esille ja tallennetaan julkaistava versio. Ero on siis
versioin-nissa, ei julkaisutahdissa.
Kuratoitu vs. kuratoimaton Kuratoidussa ontologiassa ennen
ontologian jul-kaisua ontologian kehityksen vastuuhenkilö käy
läpi ontologian muutoksetyksitellen joko hyväksyen tai hyläten
ne. Kuratointi tapahtuu lähes ainaajoittaisen arkistoinnin
ontologioissa ennen seuraavan version julkaisua.
Valvottu vs. valvomaton Valvotussa ontologiakehityksessä
ontologiassa tehdytmuutokset sekä niihin liittyvä mahdollinen
metadata tallennetaan. Valvo-mattomassa ontologiakehityksessä taas
muutoksia ei tallenneta ollenkaan taine eivät ole
hyödynnettävissä muissa työkaluissa.
Ontologioiden yhteiskehityksessä on tyypillistä, että
kehittäjillä on erilaisia roole-ja. Esimerkiksi kaikki
kehittäjät eivät välttämättä osallistu ontologian
kuratoin-tiin. Varsinkin raskaiden ontologioiden kehityksessä on
tyypillistä, että kehityk-sessä on erikseen aihealueen
asiantuntijat sekä ontologiakehittäjät. Asiantuntijattietävät
millaisia käsitteitä heidän alallaan on, mutta heillä ei ole
konkreettista tie-toa ontologian rakentamisesta.
Ontologiakehittäjät ilmaisevat ontologiamuodossaasiantuntijoiden
mallit alastaan. Samoin tesauruksissa tesauruskehittäjä voi
kysyäasiantuntijoilta apua termien määritelmiin ja käsitteiden
suhteisiin, mikäli ala onhänen osaamisalueensa ulkopuolella.
Mikäli ontologiakehittäjillä on omat vastuualansa
ontologioiden kehittämisessä, elihe toimivat asiantuntijoina ja
ontologiakehittäjinä samanaikaisesti, voidaan roo-lit jakaa
käsitteiden aihealueiden mukaan. Yksi kehittäjä voi olla
vastuussa esi-merkiksi maatalouteen liittyvistä käsitteistä ja
toinen kalan kasvatusta sivuavista.Ontologioiden kehittäminen
pienempinä ontologioina ja näistä ontologiapalasistaisomman
kokonaisuuden koostaminen helpottaa kehitystä. Yhdellä
kehittäjällä onvain tietty aihealue työn alla, jolloin
ontologia pysyy hallittavan kokoisena. On-tologioiden jakaminen
pienempiin aihealueisiin mahdollistaa sen, että
ontologiaatyöstää kyseisen aihealueen asiantuntija, jolloin
ontologian sisällöstä tulee eksak-timpi.
Yleensä useamman kehittäjän ontologiassa tavoite on se, että
kaikki kehittäjät pys-tyisivät kehittämään ontologiaa
samanaikaisesti ja näkemään toistensa tekemätmuutokset.
Valitettavasti yksittäisen ontologian yhteiskehitys ei ole aina
mahdol-lista, jolloin organisaatiossa saatetaan haluta lähteä
kehittämään omaa ontologiaa.Syitä voivat olla muun muassa:
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 20
• Ontologian kehittäjäryhmään liittyminen voi olla
rajoitettua. Kehittäjäksipääseminen voi vaatia tietyssä
organisaatiossa olemista tai mahdollisuudensitoutua ontologian
kehitykseen.
• Ontologiaeditori ei välttämättä tue tiedostomuotoa,
yhteiskehitystä tai se onliian kallis kehitysorganisaatioille.
• Kehittäjien tai -organisaatioiden näkemykset ontologian
tavoitteista ja kehi-tystahdista eivät vastaa oman organisaation
tavoitteita. Ontologia voidaanhaluta tehdä muutoksia nopealla
aikataululla, tehdä hyvin spesifejä muutok-sia tai pitää
ontologia oman organisaation sisällä.
Tilanteessa, jossa ontologiaa ei pystytä kehittämään yhtenä
ryhmänä, vaihtoeh-tona on jakaa ontologian vastuualueet
erillisiin ontologioihin, jolloin muodostuuyleisontologian ja sen
erikoisontologioiden kokonaisuus.
Linkitettyjen ontologioiden kehittämisen haasteet
Verrattuna täysin erillään kehitettäviin ontologioihin,
linkitetyissä ontologioissahyödynnetään muualla tehtyä työtä
linkittämällä erillisiä ontologioita toisiinsa.Linkitettyjen
ontologioiden kehityksen haasteena ovatkin nämä yhteydet
muihinontologioihin. Luvussa 2.3 esiteltiin kaksi erilaista
motiivia ontologioiden linkittä-miseen. Nämä vaikuttavat myös
linkityksen ylläpitoon.
Kun ontologia on linkitetty toiseen ekvivalenssiyhteyksien
avulla, on tavoittee-na yleensä toisaalla tehdyn ontologian tai
annotoidun aineiston hyödyntäminen.Ekvivalenssiyhteydellä
ilmaistaan, että kaksi käsitettä ovat samat, eikä
käsitteidenmerkitys useinkaan muutu radikaalisti ontologiaa
päivitettäessä. Tämän takia kä-sitteiden välisten linkkien
ajantasaisuutta ei tarvitse kriittisesti ylläpitää, sillä
lin-kitys vain lisää ylimääräistä tietoa itsenäisesti
toimivaan ontologiaan.
Tilanne on toinen, mikäli käsitteitä on yhdistelty toisiinsa
myös hierarkkisilla omi-naisuuksilla. Hierarkkiset ominaisuudet
ovat transitiivisia ominaisuuksia vaatienkoko hierarkiaketjun
olevan validi. Hierarkkisia suhteita voi hyödyntää
päättelyyntai kyselynlaajentamiseen, joten näiden tulisi olla
oikein, jotta haut tuottavat ha-luttuja tuloksia. Tällainen
tilanne on esimerkiksi erikoisontologioilla, jotka ovatlinkittyneet
yleisontologiaan saadakseen täydellisen hierarkian. Hierarkkisesti
lin-kittyneessä ontologiassa on tärkeää tietää, mitä
muutoksia linkityksen kohdeonto-logiassa on tapahtunut ja voivatko
ne rikkoa hierarkian konsistenttiuden tai muu-ten luoda tarvetta
lähdeontologian muuttamiseen.
Luvussa 2.3 mainittiin myös, että riippuen ontologioiden
välisen linkityksen säily-tys- ja ylläpitopaikasta, ei
linkityksen kohteena oleva ontologia ole välttämättä tie-
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 21
toinen koko linkityksen olemassaolosta. Jos kohdeontologia ei
tiedä linkityksen ole-massaolosta, voidaan kohdeontologian
kehityksessä tehdä ratkaisuja, jotka aiheut-taisivat
epätoivottuja muutoksia linkityksen lähdeontologiaan. Vaikka
linkityksetolisivat tiedossa, voivat ontologian kehittäjät
päättää, että ontologiaa kehitetäänhaluttuun suuntaan, ja
linkityksen lähdeontologiat joutuvat mukautumaan
tämänkohdeontologian muutoksiin. Tällainen tilanne on usein
yleisontologioilla, joihin onsitoutunut useita erikoisontologioita.
Erikoisontologioiden tulisi siis reagoida yleis-ontologian
muutoksiin ja täten varmistaa erikoisontologian konsistenttius.
Tätenyleisontologian muutokset aiheuttavat muutospainetta
erikoisontologiaan, muttaerikoisontologian muutoksia ei oteta
huomioon yleisontologian kehityksessä.
Mikäli linkittyneiden ontologioiden kehittäjien välinen
yhteydenpito ei ole tiivistä,syntyy ontologioihin usein
päällekkäisiä käsitteitä. Ontologioita voidaan
kehittääsamanaikaisesti, mutta vasta julkaistusta versiosta
saatetaan nähdä, että samakäsite on lisätty kumpaankin
ontologiaan. Päällekkäisyyteen reagoiminen
riippuuerikoisontologian kehitysperiaatteista. Mikäli
erikoisontologian tarkoitus on kuva-ta alansa käsitteistö
kattavasti, erikoisontologia tyypillisesti sisältää
päällekkäisiäkäsitteitä yleisontologiansa kanssa.
Tyypillisesti nämä päällekkäiset käsitteet onilmaistu
ekvivalenssiyhteydellä, joten tässäkin tapauksessa voidaan
lisätä ekviva-lenssi yleisontologian ja erikoisontologian saman
käsitteiden välille. Erikoisontolo-gian tavoite voi myös olla
listata vain yleisontologiasta löytymättömät
erikoisalankäsitteet, ja siten minimoida päivitystyötä.
Tällaisessa tilanteessa tulee tarkastellaonko päällekkäinen
käsite sama, eli tulisiko erikoisontologian käsite poistaa.
Var-sinkin samaan yleisontologiaan linkittyneiden ontologioiden
välillä on usein paljonpäällekkäisyyksiä, vaikka alat
tuntuisivat intuitiivisesti olevan sanastoltaan kauka-na
toisistaan. Esimerkkinä työkalusta erikoisontologioiden
päällekkäisyyksien tar-kasteluun on KOAN-työkalu1.
Ontologian muutosten tunnistaminen ja esittäminen
Aikaisemmassa tutkimuksessa ei ole eksplisiittisesti
määritelty, mitä ontologioidenmuutokset ovat. Tässä työssä
ontologian muutoksella tarkoitetaan sitä, että jon-kin
URI-resurssin jonkin ominaisuuden arvoon tulee muutos. Käsitteen
muutosvoi olla arvon lisäys, poisto tai muuttuminen. Tähän
määritelmään mahtuu myöskäsitteiden lisääminen ja
poistaminen, sillä käsite lisätään ontologiaan, jos
onto-logiaan ilmestyy uusi subjektina toimiva URI-tunniste. Koska
RDF-tiedostoissakolmikoiden järjestyksellä ei ole väliä, ei
ontologian muutoksia pysty luotettavas-ti tunnistamaan ilman
tiedoston lataamista muistiin ja muuttamista verkkomuo-toon.
Tässä työssä ei tarkastella syntaktisen tason muutoksia, joita
tulee seriali-
1http://www.seco.tkk.fi/tools/koan/
http://www.seco.tkk.fi/tools/koan/
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 22
sointiformaattia vaihdettaessa, eikä tyhjien solmujen (engl.
blank node) muutostentunnistamista.
Ontologioiden tulee reagoida alansa sekä käsitteellistämisen
muutoksiin. Tätä kut-sutaan ontologioiden kehittymiseksi (engl.
ontology evolution) [14]. Noy ja Klein[48] listaavat kaksi tapaa
ontologian kehittymiseen ja muutosten
tunnistamiseen.Jäljitettävässä (engl. traced)
ontologiakehityksessä muutokset ovat operaatioita janiihin voi
reagoida heti muutoksen tapahduttua. Jäljittämättömässä
(engl. un-traced) kehityksessä on vain kaksi ontologian versiota,
eikä tietoa siitä, mitä ope-raatioita ontologioiden välillä on
tehty. Nämä vastaavat valvottua ja valvomaton-ta
ontologiakehitystä. Kummallakin muutosten tunnistustavalla on
mahdollistalöytää ja listata ontologiaan tehdyt muutokset kahden
version välillä.
Ontologian muutoslokia tai kahta ontologiaversiota
hyödyntämällä voidaan tunnis-taa ontologiassa tapahtuneet
muutokset. Näitä muutoksia on mahdollista esittääeri muodoissa.
Klein ja Noy [34] ovat esitelleet seuraavat muutosten
esitysmuodot:
Muutosloki (engl. change log) listaa ontologian aikaisemman ja
myöhemmän ver-sion välillä tehdyt muutokset
aikajärjestyksessä [34]. Muutosloki on helpposaada omasta
kehitettävästä ontologiasta, mikäli ontologiaeditori
tallentaamuutokset, mutta muualla kehitettävistä ontologioista ei
välttämättä olemuutoslokia saatavilla. Ontologioiden
yhteiskehityksessä tulee lisäksi haas-teita kehittäjien
muutoslokien yhdistämisestä [34]. Muutosloki on esitysta-voista
ainoa, joka mahdollistaa ajallisen tallentamisen ja täten
muutostenkumoamisen tai uudelleen tekemisen.
Rakennevertailussa (engl. structural diff ) listataan, mitkä
käsitteet löytyvätmistäkin ontologiaversiosta sekä onko
käsite uudelleennimetty [34]. Moder-neissa ontologioissa
käsitteillä on pääsääntöisesti pysyvät URI-tunnisteet,joten
rakennevertailutiedostosta ei ole juurikaan hyötyä.
Käsitteellisillä muutoksilla (engl. set of conceptual changes)
esitetään, mitenitse käsitteet ovat muuttuneet muutoksissa [34].
Esimerkiksi, uuden käsitteenlisäyksen myötä alkuperäisen
käsitteen merkitys on voinut kaventua.
Muutosjoukko (engl. transformation set) sisältää operaatiot,
joita suorittamal-la ontologian vanhemmasta versiosta saadaan
uudempi versio. Muutosjoukkoja muutosloki ovat samankaltaisia,
mutta ne eroavat toisistaan muutamal-la tavalla. Ensinnäkin,
muutosjoukko sisältää vain muutokset, jolla versionsaa muutettua
toikseksi, kun taas muutoslokissa ovat kaikki käyttäjän
te-kemät muutokset. Toisekseen, muutosjoukossa operaatioiden
järjestykselläei ole väliä, kun taas muutoslokissa muutokset
ovat aikajärjestyksessä. Tosinhyödynnettäessä muutosjoukkoa
versiosta toiseen siirtymiseen, käsitteiden
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 23
luominen tulee tehdä ennen muiden muutosten toimeenpanoa.
Lopuksi, muu-tosjoukkoja voi olla useita mahdollisia kahden version
välillä, kun taas muu-tosloki on yksi toteutettujen
muutosoperaatioiden ilmentymä. Mikäli muu-toslokissa ei ole
kumoamisoperaatioita, on muutosloki määrityksellisesti
muu-tosjoukko.
Ylläolevista esitysmuodoista vain käsitteellisten muutosten
tunnistaminen vaatiiymmärrystä ontologian rakenteesta.
Muutosloki, muutosjoukko sekä rakennever-tailu pystytään luomaan
ilman ontologian rakenteeseen perehtymistä. Tosin
mikälirakennevertailussa halutaan tietoa uudelleennimetyistä
resursseista, vaatii tämäsekä tietoa ontologian rakenteesta
että heuristista päättelyä määrittämään
uudel-leennimeämiset.
Muutosten välittäminen linkitettyihin ontologioihin
Edellisessä aliluvussa esiteltiin esitystapoja yksittäisen
ontologian muutosten lis-taamiseen. Linkitettyjen ontologioiden
tapauksessa ontologian muutosten tunnis-tamisen jälkeen muutokset
täytyy välittää muille ontologiaan linkittyneille
ontolo-gioille. Ontologioiden muutosten välittämiseen (engl.
change propagation) on kaksitapaa: työntävä välittäminen
(engl. push-based) sekä vetävä välittäminen (engl.pull-based)
[6], jotka vastaavat löyhästi synkronista ja asynkronista
ontologiakehi-tystä.
Vetävässä välittämisessä ontologiankehittäjä pyytää
halutessaan muutokset onto-logioista, joihin hänen ontologiansa on
linkittynyt. Työntävässä muutosten välit-tämisessä
linkittynyt ontologia ei voi itse päättää, milloin ottaa
muutoksia vastaan,vaan muutokset välitetään automaattisesti
kehittäjän ontologiaan. Välitystiheyksiäon useampia [40]:
Jaksottaisessa muutosten välittämisessä (engl. periodic
delivery)muutokset työnnetään linkittyneisiin tietyn ajanjakson
välein, kun taas vaihtuva-jaksoisessa välittämisessä (engl.
ad-hoc delivery) ne työnnetään määrittelemättö-mien
ajanjaksojen välein. Välittömässä muutokset työnnetään heti
niiden onto-logiaan suorittamisen jälkeen. Työntävä välitön
muutostenvälittäminen soveltuutilanteisiin, joissa linkitettyjen
ontologioiden konsistenttius on tärkeää, sillä
muissavälitysvaihtoehdoissa ontologiat voivat olla keskenään
epäkonsistenteissa tiloissa.Hyväksyttäessä ontologioiden
väliaikaiset epäkonsistenttiudet, on vetävä välittä-minen
parempi vaihtoehto linkitettyyn kehittämiseen.[40]
-
LUKU 3. LINKITETTYJEN ONTOLOGIOIDEN PÄIVITTÄMINEN 24
Työkaluja ontologioiden muutosten hallitsemiseen
Ontologioiden muutosten alalla ei ole syntynyt yhtenäistä
muotoa ontologioidenmuutosten esittämiseen tai tallennukseen.
Tämän takia on olemassa monia erillisiätyökaluja ontologioiden
muutosten tunnistamiseen ja esittämiseen Nämä muutos-työkalut
ovat jaettavissa kahteen päätyyppiin: muutoslokiin pohjautuviin
ja muu-tosjoukkoon pohjautuviin.
Muutoslokipohjaisia työkaluja ovat muun muassa
Protégé-editorin Change-mana-gement-lisäosa [47] sekä Khattakin
ja kumppanien nimetön Protégé-lisäosa [31],joista kumpikin
olettaa, että ontologiaa kehitetään kyseisellä editorilla.
Kumpikintyökaluista pohjautuu omaan muutosontologiaansa;
ensimmäisessä ontologiana onChange and Annotation Ontology (ChAO)
ja jälkimmäisessä Change History On-tology (CHO).
Muutosjoukkopohjaisissa työkaluissa taas ei ole vaatimusta,
että ontologiaa täytyisikehittää sillä editorilla, jolle
muutostyökalu on ohjelmoitu. Esimerkkeinä
tällaisistatyökaluista on ContentCSV-työkalu [28] sekä
PROMT-lisäosa Protégé-editoriin[47], joka myöskin perustuu
ChAO-ontologiaan muutosten esittämisessä.
Muutoslokipohjaisten editorien etu muutosjoukkopohjaisiin on se,
että saman edi-torin sisällä kehitettäessä muutokset
tallennetaan aikajärjestyksessä, minkä lisäksiniihin voi
lisätä ylimääräistä tietoa annotoimalla. Luonnollisesti
lokipohjainenmuutosten esittäminen vaatii, että ontologian kaikki
kehittäjät käyttävät samaaeditoria. Muutosjoukkopohjaisessa
muutoksien esittämisessä muutokset voi tun-nistaa ontologiasta
sen kahta versiota vertailemalla, jolloin kehittäjät eivät
olesidottuja tietyn editorin käyttöön. Haittapuolena tällöin
tosin on se, että mah-dollisesti menetetään editorin tuottamat
muutostiedot, kuten milloin muutos ontehty ja kuka sen tekijä oli.
Myöskään muutostietoja ei välttämättä saada
näkyviinkehittäjän omassa editorissa, vaan hän voi joutua
käyttämään erillistä ohjelmaamuutoksien tarkasteluun.
-
Luku 4
Menetelmä
Tässä luvussa tutustutaan ensin ontologioiden muutosten
osa-alueisiin, jotka ovatjääneet vähälle huomiolle
aikaisemmissa tutkimuksissa. Tämän jälkeen esittelenmenetelmän
auttamaan erikoisontologioiden kehittäjiä yläontologioiden
suurtenmuutosmäärien kanssa.
4.1 Aikaisemmassa tutkimuksessa sivuun jäänei-
tä aiheita
Ontologioiden hyödyt tulevat parhaiten esille, kun ontologiaa
käyttää ja kehittääsuuri määrä ihmisiä eri
organisaatioista. Tämä kuitenkin johtaa erinäisiin haastei-siin
ontologioiden kehityksessä. Pinto ja kumppanit [52] ovat
huomanneet, että ai-kaisemmat tutkimukset eivät ole ottaneet
huomioon, että käytännössä ontologiake-hitys on usein
hajautettua, osittain autonomista, iteratiivistä ja sitä tekevät
muut-kin kuin ontologiaekspertit. Avaan tarkemmin seuraavaa kolmea
vähän käsitellyllähaasteella:
• Katkonaisesta ontologiakehityksestä johtuvat suuret
muutosmäärät.
• Linkitettyjä ontologioita kehittävien organisaatioiden
eroavat teknologisetvalinnat.
• Ontologiakehittäjien näkökulma ja tarpeet ontologioiden
muutoksista tiedot-taessa.
25
-
LUKU 4. MENETELMÄ 26
Katkonainen ontologiakehitys
Kuten Pinto ja kumppanit [52] toivat esiin, ontologiakehitys on
harvoin jatkuvaa.Vähäiset ajalliset tai taloudelliset resurssit
johtavat siihen, että ontologioiden kehi-tys on usein
jaksottaista. Linkitetyillä ontologioilla katkonainen kehitys voi
johtaasiihen, että linkityksen kohdeontologiassa on voinut
kehitystauon aikana tapahtuasuuri määrä muutoksia. Nämä
muutokset tulisi käydä läpi ennen lähdeontologianomien
päivitysten tekemistä, jotta ontologia pysyisi ajantasaisena ja
konsistentti-na. Vaikka linkityksen lähdeontologiaa
kehitettäisiinkin jatkuvasti, on myös mah-dollista, että
kohdeontologia ei ole jatkuvan julkaisun mallissa. Tällöin
ontologianuusi versio julkaistaan vain tietyn ajanjakson välein,
jolloin muutokset tulevat yh-dellä kertaa suurena massana.
Kummassakin ylläkuvaillussa tapauksessa haasteena on
kehittäjälle tuleva suurimäärä muutoksia. Tällaisessa
tilanteessa on vaikeaa saada käsitystä ontologian jakäsitteen
muutoksista sekä ymmärtää, miten muutoksiin tulisi reagoida
linkityksenlähdeontologiassa.
Suurten muutosmäärien huomioimisesta ei ole ollut puhetta
aikaisemmassa tutki-muksessa. Työkalujen arvioinnit on tehty
pienillä ontologioilla, kuten tutkimuksis-sa [2, 32], ja
kuvankaappauksissa on muutoksia kerrallaan nähtävissä vain
muuta-mia, kuten tutkimuksissa [29, 47].
Linkitetty ontologiakehitys eri organisaatioissa
Luvussa 3.2 listattiin syitä, miksi erillisiä linkitettyjä
ontologioita kehitettäisiinyksittäisen ontologian
yhteiskehityksen sijaan. Koska linkitettyjä ontologioita
ke-hitetään yleensä eri organisaatioissa, voi toisiinsa
linkittyneiden ontologioiden ke-hittämiseen olla käytössä eri
ontologiaeditoreita. Lisäksi editorien muutostyöka-luilla ei ole
yhteistä muutostentallennusmuotoa, joten editoreiden väliset
muutos-muodot ovat keskenään yhteentoimimattomia, eikä muutoksia
voi siirtää editoristatoiseen ilman erillistä muunnosta. Ei ole
myöskään itsestäänselvyys, että ontolo-gioista ylipäätään
julkaistaisiin muutoslistoja julkisesti.
Aiemmassa tutkimuksessa ei ole otettu huomioon linkitetyn
ontologiakehityksenhaasteita eri editorien ja teknologioiden
käytössä, vaan on oletettu, että hajautettukehitys tapahtuu
samalla editorilla, kuten esimerkiksi Sunagawa ja kumppanit
[62]ovat ajatelleet.
-
LUKU 4. MENETELMÄ 27
Ontologiakehittäjien näkökulma
Aikaisemmassa tutkimuksessa ollaan keskitytty uusien menetelmien
ja työkalujenluomiseen ontologioiden muutosten tunnistamiseen ja
välittämiseen. Näissä töissämuutosten esitysmuotojen ja
optimaalisten käyttöliittymäratkaisujen tutkiminensekä
ontologiakehittäjien tarpeet ovat olleet taka-alalla.
Muutosten esittämistapoja on esitelty lyhyesti sanallisesti ja
muutosten esittämi-sestä on ollut muutamia kuvankaappauksia,
kuten [28, 47]. Kuitenkaan keskusteluakäyttöliittymätoteutusten
hyvistä ja huonoista puolista ei ole.
Valitettavan usein työkalujen arvioinneissa testikäyttäjät
eivät ole itse ontologia-kehittäjiä, tai itse testit kestävät
vain muutamia tunteja. Näillä saadaan kyllä tes-tattua toimiiko
työkalu odotetusti, mutta arvokasta lisätietoa
ontologiakehittäjientarpeista ja toiveista ei tule kentältä
kuultavaksi. Poikkeuksena tälle ovat olleetMillerin ja kumppanien
[44] suunnitteluperiaatteet, Noyn ja kumppanien [47] lis-taamat
käyttäjätarpeet ontologioiden yhteiskehityksessä sekä Braunin
ja kumppa-nien [8] SOBOLEO-editorin käytön arviointi.
4.2 Menetelmä ontologioiden suurten muutosmää-
rien esittämiseen
Tässä luvussa esittelen oman menetelmäni siihen, miten
erikoisontologiakehittäjilletulevia yleisontologian suuria
muutosmääriä pystyy muuttamaan hallittaviksi jahavainnoitaviksi
kokonaisuuksiksi. Alla käytän termejä yleisontologia ja
erikoison-tologia selvyyden vuoksi, mutta menetelmä on
sovellettavissa mille tahansa linkite-tyille lähde- ja
kohdeontologioille. Lisäksi menetelmää voi hyödyntää myös
yhteis-kehitettäviin kevytontologioihin, joissa kehittäjillä on
vastuullaan tietyt merkitytkäsitteet.
Menetelmä perustuu neljään pääajatukseen:
• Yleisontologian muutosten läpikäyntijärjestystä voi
priorisoida, koska kaikkiyleisontologian muutokset eivät
välttämättä aiheuta muutoksia erikoisonto-logiaan.
• Erikoisontologiakehittäjä voi hyötyä muistakin tiedoista
kuin pelkästä listas-ta yleisontologian muutoksia.
• Kaikki yleisontologian yhteen käsitteeseen tehdyt muutokset
tulee nähdäkerralla.
-
LUKU 4. MENETELMÄ 28
• Yleisontologian muutostietojen tulee olla
editoririippumattomassa muodos-sa.
Muutosten priorisointi
Laajojen kevytontologioiden suurten muutosmäärien alla on
tärkeää priorisoidamuutosten teon järjestystä.
Kevytontologioita käytetään pääasiassa aineiston
an-notoinnissa ja hakujärjestelmissä, joten ontologian
konsistenttius ei ole niin kriit-tistä kuin päättelyyn
käytettävillä raskasontologioilla. Tämän johdosta
kevyton-tologioiden muutoksia voi priorisoida siten, että
muutosten tarkastelu aloitetaanniistä yleisontologian muutoksista,
jotka mitä luultavimmin vaativat muutoksiayleisontologiaan
liittyneessä erikoisontologiassa. Tämä vastaa Falconerin ja
kump-panien ehdottamaa muutosten suodattamista [12] sekä Braunin
ja kumppanienraportoimaa tarvetta käyttäjäkohtaiselle
personoinnille [8].
Muutokset, jotka ovat tapahtuneet lähellä erikois- ja
yleisontologian linkityskoh-tia voivat suuremmalla
todennäköisyydellä aiheuttaa muutoksia erikoisontologias-sa kuin
kauempana yhtymäkohdasta tapahtuneet muutokset. Esimerkiksi jos
eri-koisontologia käsittelee kielitiedettä, on foneemi-käsitteen
muutos todennäköisestikiinnostavampi kuin kaulahuivit-käsitteen,
sillä erikoisontologialla on luultavastiyhteyksiä muihin
kielitieteen käsitteisiin, muttei vaatetukseen liittyviin
käsitteisiin.Kun tärkeimmät muutokset on käyty läpi, voidaan
myös epätodennäköisemmätmuutospaineen aiheuttajat käydä
läpi, mikäli resursseja on yhä käytössä.
Vaikka yleisesti voi sanoa, että muutos on tärkeä
ontologioiden linkityskohdanlähellä, vaikuttaa tärkeyteen
lisäksi muita seikkoja. Myös tehdyn muutoksen tyyp-pi,
ontologioiden väliseen linkitykseen käytetyt ominaisuudet sekä
erikoisontolo-giassa käytössä olevat ominaisuudet voivat
vaikuttaa siihen, mitkä muutokset
ovaterikoisontologiakehittäjälle tärkeitä.
Muitakin tietoja kuin lista muutoksista
Yleisontologian muuttuessa voi erikoisontologian kehittäjälle
olla hyödyllistä nähdämyös muutoksista johdettuja tietoja,
esimerkiksi tieto siitä, mitkä yleisontologiaanlisätyistä
käsitteistä jo ovat erikoisontologiassa. Tähän informaation
tarvitaan ylei-sontologian muutostiedon yhdistäminen
erikoisontologian tietoon vastaavasti kuinStuckenschmidtin ja
Kleinin kompleksiset muutokset [60]. Muutosten esittämisenei
tulisi välttämättä rajautua pelkkiin muutosten esittelemisiin
vaan tarjota sel-laisia listoja ja näkymiä, mitä
erikoisontologiakehittäjät tarvitsevat päivityksensätueksi.
-
LUKU 4. MENETELMÄ 29
Käsitteen muutokset nähtävissä kerralla
Ontologian käsitteen kaikki muutokset tulee olla kerralla
nähtävissä, kuten Prompt-Diff-työkalussa [49]. Tämä
mahdollistaa yleiskuvan saamisen käsitteestä, toisinkuin ISO
25964-1 -standardin pelkkä muutostyypeittäin listaaminen.
Editoririippumattomuus
Ontologioiden muutosten tunnistamiseen ja esittämiseen ei ole
standardeja. Edito-rien tarjoamat muutosten
tarkastelujärjestelmät poikkeavat toisistaan ja
tuottavaterilaista muutosdataa. Välillä myös ontologiaeditoria
voidaan haluta vaihtaa, jol-loin haasteeksi tulee muutostietojen
muuttuminen. Lisäksi yleisontologiaa ja senerikoisontologioita ei
välttämättä kehitetä samaa editoria käyttäen. Näiden
syidentakia on tärkeää, että muutosten esittäminen ei vaadi
editorispesifejä ratkaisuja,vaan että muutokset voidaan tunnistaa
ja esittää mahdollisimman samankaltai-sesti editorista
riippumatta.
-
Luku 5
MUTU-muutostentunnistustyökalu
Tässä diplomityössä kehitettiin prototyyppityökalu
yleisontologian muutosten tun-nistamiseen ja välittämiseen
erikoisontologiakehittäjille. Työkalu sai nimekseenmutu ja sen
ominaisuudet perustuvat luvun 4 periaatteille.
mutu-työkalun kehityksen pohjana olivat yleisimmät
ominaisuudet, joita kevyton-tologioissa käytetään. Lisäksi
kehityksen alussa keskusteltiin tarpeista ontologiake-hittäjän
kanssa, minkä johdosta työkaluun sisällytettiin samannimisten
käsitteidentunnistaminen yleis- ja erikoisontologian välillä
sekä kehittäjälle turhien ominai-suuksien sivuuttaminen
muutoslistoja luodessa. Lisäksi assosiatiivisen ominaisuu-den
muutoksille lisättiin erilliset alakategoriat suhteen
lisäykselle, poistolle sekäkorvaukselle.
Tässä luvussa esitellään ensin, miten mutu-työkalua
käytetään. Tämän jälkeenperehdytään muutostyyppeihin ja
tärkeisiin muutoksiin. Lisäksi esittelen mitenmutu esittää
muutokset sekä mitä muita skriptejä mutun käyttämiseen
saatetaantarvita.
5.1 MUTU-työkalun käyttäminen
Kuvassa 5.1 on kaavio siitä, mitä tiedostoja tarvitaan
mutu-muutoslistausten luo-miseen sekä mitkä ovat mutu-ohjelman
pääkomponentit ja lopputulostiedostot.mutun itsensä toiminta
jakautuu kolmeen osaan: muutosten listaamiseen, erikoi-sontologian
muokkaamiseen sekä muutosten esittämiseen.
30
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 31
Kuva 5.1: mutun pääkomponentit syöte- ja
tulostetiedostoineen
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 32
Syötetiedostot
mutu-ohjelma vaatii ajoonsa seuraavat tiedostot:
• erikois-ja-yleisontologia-tiedostoRDF/XML-muotoinen tiedosto,
joka sisältää erikoisontologian ja vanhan ver-sion
yleisontologiasta
• uusi versio yleisontologiastaRDF/XML-muotoinen tiedosto, joka
sisältää uusimman version yleisontolo-giasta
• serialisoidut lemmatyleisontologian etukäteen
perusmuotoistetut nimikkeet
• konfiguraatiotiedostotekstitiedosto, joka sisältää
ontologioiden tietoja: ontologioiden käsitteidenkäytössä olevat
nimiavaruudet ja erityyppisten ominaisuuksien URI-tunnis-teet.
Lisäksi tiedosto sisältää listan ominaisuuksista, joiden
muutokset tulisisivuuttaa.
• lokalisointitiedostotekstitiedosto, joka sisältää
muutoslistauksen otsikot ja muut tekstit yhdelläkielellä
Muutosten listaaminen
Muutosten listaamisessa edetään siten, että ensin
selvitetään mitkä käsitteet onlisätty ja poistettu
yleisontologiasta versioiden välillä. Lisätyt käsitteet
löytyvätvain uudesta versiosta ja poistetut vain vanhasta
versiosta. Kun lisättyjen ja pois-tettujen käsitteiden listat on
luotu, tarkastellaan kummassakin ontologian versios-sa olleita
käsitteitä.
Ontologian muutoksien selvittäminen tehdään käsite
kerrallaan, verraten mitäominaisuuksia ja niiden arvoja
käsitteellä on ollut yleisontologian uudessa ja van-hassa
versiossa diff-algoritmin avulla. Diff-algoritmin tuottamien
lisäyksiä ja pois-toja yhdistelemällä voidaan esittää myös
korvatut arvot, eli ominaisuudet, joille onsekä lisätty että
poistettu arvo. Tämän jälkeen muutokset lajitellaan
muuttuneenominaisuuden mukaan muutostyyppeihin.
Samannimisten käsitteiden tunnistaminen perustuu yleis- ja
erikoisontologian ni-mikkeiden perusmuotojen vertailuun.
Tavoitteena on löytää mahdollisimman pal-jon ehdotuksia samoiksi
käsitteiksi, joten vertailuun on sisällytetty sekä
oletusni-mikkeet (prefLabel) että vaihtoehtoiset nimikkeet
(altLabel). Kun on tunnistettu
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 33
käsitteet, joilla on samannimisiä nimikkeitä, hylätään
näistä käsiteparit, joilla onjo ekvivalenssiyhteys
toisiinsa.
Erikoisontologian muokkaaminen
On mahdollista, että yleisontologiasta poistuneisiin
käsitteisiin on luotu linkkejäerikoisontologiasta. Tämän takia
tulee poistaa yhteydet näihin kolmikoihin erikoi-sontologiasta,
jotta ontologiassa ei ole viittauksia olemattomiin käsitteisiin.
Nämäpoistetut kolmikot listataan erikoisontologiakehittäjälle
muutoslistausten yhtey-dessä.
Muutosten esittäminen
Muutosten listaamisen ja erikoisontologian konsistenttiuden
varmistamisen jälkeenon edessä muutosten visualisointi.
Muutostyyppilistojen muutokset käydään tyy-pittäin ja
prioriteeteittain läpi ja näiden muutokset ohjataan
visualisointiluokilletoteutettaviksi.
Tulostetiedostot
mutu-ohjelma tuottaa ajossaan kolme tiedostoa:
• päivitetty erikois-yleisontologia-tiedostoRDF/XML-muotoinen
tiedosto, joka on vastaava kuin syöttötiedoston
erikois-ja-yleisontologia-tiedosto. Tämä tiedosto eroaa
syötetystä tiedostosta siten,että yhteydet yleisontologiasta
poistettuihin käsitteisiin on poistettu.
• yleisontologia merkityillä muutoksillaRDF/XML-muotoinen
tiedosto, joka on vastaava kuin syötetty yleisontologia-tiedosto,
mutta ontologian sisältää ylimääräisiä ryhmiä listaamaan ja
ryh-mittelemään muuttuneet käsitteet. Yksittäisen käsitteen
tietää muuttuneensiitä, että sillä on subClassOf-suhde
johonkin näistä ryhmistä.
• muutoslistausHTML-verkkosivu, joka listaa muutostyypeittäin
ja prioriteeteittäin muuttu-neet käsitteet sekä näyttää,
miten käsitteet ovat muuttuneet. Sisältää myöslistan
erikois-ja-yleisontologiasta poistetuista kolmikoista.
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 34
5.2 Muutostyypit ja muutosten tärkeys
mutu pyrkii helpottamaan erikoisontologiakehittäjien
päivitystyötä luokittelemal-la yleisontologian muutokset sekä
muutostavan että muutoksen tärkeyden mukaan.Muutostavan mukaan
erotellessa on tavoitteena ryhmitellä yhteen samalla
tavoinmuuttuneet käsitteet, sillä ne mitä luultavimmin
aiheuttavat samankaltaisia muu-toksia erikoisontologiaan. Muutosten
tärkeyden perusteella lajittelu mahdollistaasen, että
ontologiakehittäjät kohdistavat mahdollisesti rajalliset
kehitysresurssitensin sellaisiin muutoksiin, joilla on suurin
todennäköisyys aiheuttaa muutoksiaerikoisontologiaan.
Muutosten prioriteeteilla on kaksi arvoa: tärkeä tai muu.
Tärkeät muutokset ovatsellaisia, jotka tulisi käydä läpi ennen
muita muutoksia. Tärkeät muutokset onkuvattu alla muutostyyppien
kohdalla ja muut muutokset ovat sellaisia, jotka eivätsovi
tärkeiden muutosten määritelmään.
mutussa on kaksi päämuutostyyppiä: muutokset käsitejoukossa
sekä yksittäisenkäsitteen muutokset. Kuten alta
muutostyyppilistasta voi huomata, jo päämuutos-tyypit eroavat
toisistaan huomattavasti. Tämän takia ei ole mahdollista
määrittääyhtä tiettyä testiä tai mittaa tärkeydelle, vaan
se on määritettävä muutostyy-peittäin.
Seuraavaksi esittelen kaikki mutussa olevat muutostyypit sekä
listaan, millai-set muutokset ovat kyseisessä muutostyypissä
korkeammalla prioriteetillä. Ennenmutu-ajoa on voitu
määrittää, minkä ominaisuuksien muutokset eivät milloin-kaan
kiinnosta erikoisontologian kehittäjää, joten nämä muutokset
eivät edes il-mesty muutoslistauksiin.
mutun muutostyypit ovat:
• käsitejoukon muutokset
– lisätyt käsitteet
– poistetut käsitteet
– samannimiset käsitteet
• yksittäisen käsitteen muutokset
– hierarkiamuutokset
– nimikemuutokset
– assosiatiivisuusmuutokset
– osa-kokonaissuhdemuutokset
– muut muutokset
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 35
Käsitejoukon muutokset
Käsitejoukon muutokset sisältävät kokonaisten käsitteiden
lisäykset tai poistotsekä näihin liittyvät muut listaukset.
Lisätyt käsitteetMuutos: Käsitteet, jotka on lisätty
yleisontologiaan sen vanhan ja uudenversion välillä. Käsite
löytyy uudesta versiosta, muttei vanhasta.
Tärkeitä: Lisätyt käsitteet, joiden välillisellä tai
välittömällä alakäsitteelläon yhteys erikoisontologian
käsitteeseen. Erikoisontologian kehittäjän tuleetarkastella,
onko koko hierarkiaketju linkitetystä
erikoisontologiakäsitteestäontologian juureen yhä oikein.
Poistetut käsitteetMuutos: Käsitteet, jotka on poistettu
yleisontologiasta vanhan ja uuden ver-sion välillä, eli käsite
löytyy vanhasta versiosta, muttei uudesta.
Tärkeitä: Kaikki poistuneet käsitteet ovat tärkeitä, sillä
käsitteet tulisi hau-data tai arkistoida ontologiasta poistamisen
sijaan. Täten kaikki poistetutkäsitteet tulisi tarkistaa.
Samannimiset käsitteetMuutos: Ei varsinainen muutos, vaan
käsitteet, joilla on samoja nimikkeitä.Kaikkia nimikkeitä
verrataan keskenään riippumatta nimikkeen ominaisuu-desta. Täten
jos toisessa käsitteessä nimike ”home”on
prefLabel-ominaisuu-dessa ja toisessa altLabel-ominaisuudessa,
ehdotetaan näitä kahta käsitettäsamoiksi käsitteiksi. Lisäksi
nimikkeet muunnetaan tarkastelua varten pe-rusmuotoon ja
nimikkeitä verrataan vain kielittäin.
Tärkeitä: Yleisontologiaan käsitteet, joilla on sama
nimikkeen perusmuotokuin joillakin erikoisontologian käsitteellä,
mutta näiden välillä ei ole ekviva-lenssiyhteyttä. Nämä
käsitteet voivat olla sama käsite, jolloin näiden välilletulisi
joko lisätä ekvivalenssiyhteys tai poistaa päällekkäinen
käsite erikoi-sontologiasta.
Käsitteiden muutokset
Käsitteiden muutokset ovat ominaisuuksien arvojen
lisäämisiä, poistoja tai kor-vauksia käsitteillä, jotka
esiintyvät sekä yleisontologian vanhassa että uudessa
ver-siossa.
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 36
HierarkiamuutoksetMuutos: Käsitteen yläkäsite on lisätty,
poistettu tai korvattu toisella käsit-teellä.
Tärkeitä: Muutos käsitteessä, jonka välillisellä tai
välittömällä alakäsitteelläon hierarkkinen yhteys
erikoisontologian käsitteeseen. Tällaisessa tapaukses-sa on
syytä tarkistaa onko hierarkiaketju vielä hyväksyttävä
erikoisontolo-gian puolella.
NimikemuutoksetMuutos: Käsitteeseen on lisätty, poistettu tai
korvattu oletusnimike (prefLa-bel) tai vaihtoehtoehtoisia
nimikkeitä (altLabel). Muutoksia vertaillaan kie-littäin.
Tärkeitä: Oletusnimike (prefLabel) korvattu käsitteessä,
jolla on ekvivalens-siyhteys johonkin erikoisontologian
käsitteeseen. Tässä tapauksessa hyvä tar-kistaa, tarvitseeko
myös erikoisontologian käsitteen nimikettä päivittää.
AssosiatiivisuusmuutoksetMuutos: Käsitteeseen on lisätty,
poistettu tai korvattu assosiatiivinen suhdetoiseen
käsitteeseen.
Tärkeitä: Muutos käsitteessä, jolla on ekvivalenssiyhteys
johonkin erikoison-tologian käsitteeseen. On hyvä tarkistaa
tarvitseeko myös erikoisontologiankäsitteen assosiatiivisia
suhteita päivittää.
Osa-kokonaissuhdemuutoksetVastaava kuin hierarkiamuutos, mutta
partOf-ominaisuudelle.
Muut muutoksetMuut muutokset ovat muutoksia muissa kuin yllä
kuvatuissa ominaisuuksis-sa. Näitä ei ole lajiteltu prioriteetin
mukaan.
Yhteenvetona tärkeydestä voidaan tiivistää, että on
tärkeää tarkistaa transitiivis-ten ominaisuusketjujen
paikkansapitävyys lisätyillä käsitteillä, sekä hierarkia-
jaosa-kokonaisuussuhteiden osalta. Muissa tapauksissa
ekvivalenssikäsitteiden muu-tosten tarkastelu on riittävää.
5.3 Muutosten visualisointitavat
mutu-työkalulla lajitellut muutokset visualisoidaan
erikoisontologiakehittäjille kah-della eri tavalla: verkkosivulla
esitettävinä muutoslistoina sekä yleisontologiaan
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 37
merkittyinä käsitteinä, jotka sisältävät
rdfs:subClassOf-suhteen johonkin muutos-ryhmään.
Muutoslistaus
Muutoslistauksen perusajatuksena on listata aliluvussa 5.2
esitellyt muutokset.Kuvakaappauksia muutoslistauksesta löytyy
kuvista 5.3-5.6. Muutoslistojen tuot-tohetkellä tärkeitä
muutoksia kutsuttiin vielä ”kiinnostaviksi muutoksiksi”.
Muutoslistauksen tavoite on esittää
erikoisontologiakehittäjälle selkeästi ja ymmär-rettävästi
yleisontologian muutokset muutostyypeittäin ja prioriteeteittäin.
Muu-tokset esitetään verkkosivuna, josta voi avata ja sulkea
muutoslistoja tarpeen mu-kaan (kuva 5.2). Listan nimen vieressä on
suluissa numero, joka kuvaa kuinkamonta käsitettä on muuttunut
kyseisellä tavalla. Tämän otsikkorivin alla on vieläkuvaus
siitä, millaisia kyseiset muutokset ovat ja tärkeissä
muutoksissa vielä sa-nallinen kuvaus siitä, millaiset muutokset
ovat luokiteltu tärkeiksi.
Käsitteistä esitetään aina vähintään oletusnimike ja sen
perässä suluissa käsitteenURI-tunniste lyhennetyssä muodossa.
URI-tunnisteet toimivat linkkeinä ja ne oh-jaavat
ontologiaselaimeen, josta pääsee tarkastelemaan käsitteen
tietoja.
Seuraavaksi esittelen sanallisesti, miten eri muutostyypit on
verkkosivulla esitettysekä missä kuvakaappauksessa ominaisuus on
esillä.
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 38
Lisätyt käsitteet Esitellään itse lisätyn käsitteen
lisäksi ne lisätynkäsitteeseen lähimmät välilliset tai
välittömätalakäsitteet, joilla on yhteys
erikoisontologiaan.(Kuva 5.3)
Poistetut käsitteet Jokaisen poistetun käsitteen vierestä
pystyy laa-jentamaan näkyville kolmikot, jotka on
poistettuontologian konsistenttiuden takaamiseksi. (Kuva5.4)
Samannimiset käsitteet Löydettyjen käsitteiden listassa on
ensin listattunimikkeen perusmuoto, jonka perusteella käsitteeton
tunnistettu samoiksi. (Kuva 5.5)
Yksittäisen käsitteen muutokset Käsitteen kohdalla on aina
listattu käsitteen kaik-ki muutokset, mutta kyseisen muutostyypin
muu-tokset on korostettu. Tämä mahdollistaa yleisku-van saamisen
käsitteen muutoksista, sillä käsitteeneri ominaisuuksien
muutokset vaikuttavat toisiin-sa. (Kuva 5.6)
Nimikemuutokset Muutokset on eroteltu kielen mukaan.
Tämänlisäksi erikoisontologian kehittäjän työtä onpyritty
helpottamaan siten, että kielet onjärjestetty
prioriteettijärjestykseen erikoisontolo-giassa käytettyjen
kielten mukaan. Koska erikoi-sontologiakehittäjä korjaa yleensä
koko käsitteenkerralla, olisi turhaa näyttää sama muutos
moneenkertaan alempien prioriteettisten kielten listoissa.Täten
listojen sisältävät muutokset ovat aina sel-laisia, joita ei ole
aikaisemmissa kielissä esitelty.(Kuva 5.6)
Assosiatiiviset muutokset Muista muutostyypeistä poiketen,
assosiatiivisetmuutokset on jaoteltu edelleen lisäyksiin,
poistoi-hin ja korvauksiin. Ontologiakehittäjien toive olipitää
assosiatiiviset ominaisuudet erillään, sillä neovat
ylimääräistä tietoa. (Muutokset on esitettyvastaavasti kuin
kuvassa 5.5)
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 39
Kuva 5.2: Kuvakaappaus mutu-työkalun tuottamasta
muutoslistauksesta. Lisätytkäsitteet -kategoria on avattu, jotta
nähdään tärkeiden (kuvassa ”Kiinnostavat”)ja muiden muutosten
määrät.
Kuva 5.3: Kuvakaappaus tärkeiksi luokitelluista lisätyistä
muutoksista. En-simmäisellä rivillä on lisätty käsite ja sen
alla on listattu sen lähimmät alakäsitteet,joilla on yhteys
erikoisontologiaan.
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 40
Kuva 5.4: Kuvakaappaus yleisontologiasta poistuneista
käsitteistä. ”arvopa-pereidenvälittäjät”-käsitteen alla on
avattu käsitteen poiston takia
yleis-ja-erikoisontologiatiedostosta poistetut kolmikot.
Kuva 5.5: Kuvakaappaus samannimisiksi tunnistetuista
käsitteistä. Ensimmäisellärivillä on perusmuoto, jonka
perusteella käsitteet on luokiteltu samaksi käsitteeksi.Tämän
alla ovat käsitteiden oletusnimikkeet sekä URI-tunnisteet.
Kuva 5.6: Tärkeiksi luokiteltuja nimikemuutoksia esimerkkinä
käsitteen muutok-sien esittämisestä. Kyseisen muutosluokan
ominaisuus on korostettu.
-
LUKU 5. MUTU-MUUTOSTENTUNNISTUSTYÖKALU 41
Ontologiaan merkityt muutokset
Erikoisontologian kehitystiedostoon lisättävät muutokset on
tarkoitettu tukemaanmuutoslistauksen käyttöä. Ontologiaan
luotiin ylimääräisiä käsitteitä edustamaaneri muutostyyppejä
ja näiden tärkeyksiä. Yleisontologian muuttuneet käsitteet
lin-kitettiin sitten näihin eri muutostyyppeihin
subClassOf-ominaisuuden avulla. Aja-tuksena oli, että
erikoisontologiakehittäjä voisi ontologiaa muokatessaan
nähdämyös ontologiaeditorissa muuttuneen käsitteen muutostyypin
sekä listan muut-tuneista käsitteistä muutostyypeittäin. Tätä
muutostyyppilistaa voisi hyödyntääpäivityksen edistymisen
seuraamiseen. Nämä muutostyyppilistat voisi toteuttaamyös
ontologiaeditorissa tehtävillä SPARQL-kyselyillä, mutta
kaikkissa ontolo-giaeditoreissa ei ole tuke SPARQL-kyselykielelle.
Tämän takia muutostyypit pitilisätä fyysisesti
ontologiatiedostoon, eikä niitä voinut tuottaa ja päivit