Top Banner
Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.Hemmje FernUniversität in Hagen Ontologie-basierte Informationsnutzung 2. Kapitel des Buches „Information Sharing on the Semantic Web“ von Stuckenschmidt und Van Harmelen. Inhalt 1.0 Semantische Heterogenität 2.0 Ontologien 2.1 Der Begriff der Ontologie 2.2 Wie sieht nun eine Ontologie aus? 2.3 Gemeinsam genutztes Vokabular und die Konzeptualisierung 2.3.1 Konzeptualisierung 2.3.2 Gemeinsam genutztes Vokabular 2.4 Die Spezifikation eines Wissenskontexts 2.4.1 Grad der Formalität 2.4.2 Das Ausmaß der Definitionstiefe 2.5 Anwendungsgebiete für Ontologien 3.0 Die Rollen von Ontologien bei der Informationsintegration 3.1 Repräsentationsarchitekturen 3.1.1 Der Single-Ontology-Ansatz 3.1.2 Multiple – Ontologie-Ansatz 3.1.3 Hybrid-Ansatz 3.2 Query-Modell 3.3 Verifikation 4.0 Ein Framework für die Informationsnutzung 5.0 Der Übersetzungsprozess und Ontologie-Aligning 5.1 Ontologie-Aligning 6.0 Ontologie-Engineering 7.0 Fazit Anhang Glossar Literaturverzeichnis Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 5673356 1
21

Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Sep 24, 2019

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Ontologie-basierte Informationsnutzung2. Kapitel des Buches „Information Sharing on the Semantic Web“ von

Stuckenschmidt und Van Harmelen.

Inhalt

1.0 Semantische Heterogenität

2.0 Ontologien

2.1 Der Begriff der Ontologie

2.2 Wie sieht nun eine Ontologie aus?

2.3 Gemeinsam genutztes Vokabular und die Konzeptualisierung

2.3.1 Konzeptualisierung

2.3.2 Gemeinsam genutztes Vokabular

2.4 Die Spezifikation eines Wissenskontexts

2.4.1 Grad der Formalität

2.4.2 Das Ausmaß der Definitionstiefe

2.5 Anwendungsgebiete für Ontologien

3.0 Die Rollen von Ontologien bei der Informationsintegration

3.1 Repräsentationsarchitekturen

3.1.1 Der Single-Ontology-Ansatz

3.1.2 Multiple – Ontologie-Ansatz

3.1.3 Hybrid-Ansatz

3.2 Query-Modell

3.3 Verifikation

4.0 Ein Framework für die Informationsnutzung

5.0 Der Übersetzungsprozess und Ontologie-Aligning

5.1 Ontologie-Aligning

6.0 Ontologie-Engineering

7.0 Fazit

Anhang

GlossarLiteraturverzeichnis

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733561

Page 2: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Ontologie-basierte gemeinsame Informationsnutzung

Der rege genutzte Informationsaustausch über das World Wide Web (WWW) hat den Bedarf nach inhaltsbasiertem Wissen enorm gesteigert, weil z.B. die Stichwortsuche über Suchmaschinen zu viele und zu unterschiedliche Ergebnisse lieferte oder aufgrund der Globalisierung eine effektivere Kollaboration verschiedener Organisationen notwendig wurde. In dieser Seminararbeit wird der Frage nachgegangen, wie eine maschinenauswertbare Semantik dargestellt werden kann, um die Sachverhalte eines Anwendungsgebiets hinreichend aussagekräftig zu beschreiben und warum ein standardisiertes Vokabular für die gemeinsame Informationsnutzung notwendig ist.

1.0 Semantische Heterogenität

Die im WWW vorhandenen Informationen allein sind noch kein Wissen. Damit Information zu Wissen wird, müssen auch die wechselseitigen ideellen Beziehungen klar sein. Um Wissen zu nutzen, müssen die Verbindungen, die das Zusammenwirken von Begriffen beschreiben, leicht abrufbar, aktualisierbar und manipulierbar sein[Kurzweil,1990]. Wenn man die im schwach strukturierten WWW vorhandenen Informationen als eine gemeinsame Wissensbasis nutzen möchte, muss man sich zunächst dem komplexen Begriff der „Heterogenität“ bewusst sein. Neben der strukturellen, syntaktischen und systemtechnischen Heterogenität, ist die semantische Heterogenität, die sich auf die unterschiedlichen Konzepte und ihren Interpretationen bezieht, das größte Problem für die automatische Wissensverarbeitung[Cui,2000]. Während Menschen aufgrund ihrer kognitiven Fähigkeiten den Kontext einer Wissensressource auf vielfältige Arten ab- bzw. herleiten können, sind techn. Systeme nur dann dazu in der Lage, wenn diese vorher formal explizit beschrieben worden sind. Die semantische Heterogenität kann in 3 verschiedene Typen von Konzepten klassifiziert werden [Cui,2000]:

• semantisch equivalente Konzepte, bei dem z.B. verschiedene Begriffe sich auf ein und dasselbe Konzept beziehen oder verschiedene Eigenschaften für das gleiche Produkt von zwei Systemen modelliert werden,

• semantisch unabhängige Konzepte, bei semantisch unabhängigen Konzepten kann es zu Verständnisproblemen kommen, wenn der gleiche Begriff für unterschiedliche Konzepte verwendet wird, wie z.B. „Käfer“ für ein „Tier“ oder für ein „Auto“ .

• semantisch abhängige Konzepte, semantisch abhängige Konzepte beschreiben die Heterogenität anhand der Generalisierung und Spezifizierung. Ein System kennt nur Früchte, das andere aber kennt Äpfel, Orangen und Bananen etc. Auch Skalierungskonflikte, das eine System klassifiziert „Kind“ als Menschen im Alter zwischen 5 und 12 Jahren, das andere zwischen 3 und 10 Jahren, das dritte System klassifiziert „Kind“ als Menschen, die kleiner als 140 cm sind.

Die durch die semantische Heterogenität entstehenden Konflikte erschweren die Interoperabilität zwischen Softwareagenten oder Webservices, die Informationen nicht nur wiederverwenden sondern auch verarbeiten wollen. Missverständnisse, hervorgerufen durch Begriffe und ihren Attributen, kann man durch Vereinbarungen und Standardisierungen eleminieren. Ontologien reduzieren das Problem der Heterogenität und können daher für die gemeinsame Informationsnutzung eingesetzt werden[Buccela,2005].

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733562

Page 3: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

2.0 Ontologien

2.1. Der Begriff OntologieDer Begriff „Ontologie“ (gr.óntos = Sein, lógos = Lehre) bezeichnet das Studium der Kategorisierung von Dingen, die existieren oder in einigen Interessensgebieten bestehen können. Das Ergebnis einer solchen Studie, eine Ontologie, ist ein Katalog von Typen von Dingen D, von denen man annimmt, dass sie aus der Sicht einer Person, die eine Sprache L benutzt, um über diesen Interessensbereich D zu sprechen, existieren[SOWA,2003].Die Forschungsarbeiten auf dem Gebiet der Künstlichen Intelligenz adaptierten den Begriff der Ontologie aus der Philosophie für die Repräsentation und maschinelle Verarbeitung von komplexen Wissensstrukturen. Die berühmteste und meist zitierte Definition einer Ontologie stammt von Tom Gruber 1993: „Ontology is an explicit specification of a conceptualisation.“

Eine Konzeptualisierung bezieht sich auf ein abstraktes Modell von dem, wie sich Menschen die Dinge in der realen Welt vorstellen, wie z.B. einem Stuhl. Eine explizite Spezifizierung gibt den Konzepten und Relationen des abstrakten Modells explizit Namen und Definitionen[covischlie, 2002]. Grubers Definition ist oft noch um drei weitere Eigenschaften erweitert worden: „An ontology is an explicit, formal specification of a shared conceptualization of a domain of interest“

‚Formal’ meint in diesem Sinne, dass die Ontologie maschinenlesbar sein soll. Mit ‚shared’ drückt man aus, dass die Ontologie ein Wissen erfasst, das auf gegenseitige Übereinstimmung beruht und nicht privat ist, sondern von einer Gruppe gemeinschaftlich akzeptiert und genutzt wird. Der Hinweis auf ‚a domain of interest’ erläutert, dass man nicht daran interessiert ist, die ganze Welt zu modulieren, sondern nur die für die Arbeit und Aufgabe relevanten Teile. [Staab and Studer,2004] [sekt(661),2003].

Eine Ontologie stellt ein Vokabular bereit, um einen Wissensbereich darzustellen, in dem es Prädikate verwendet, die die Beziehungen zwischen den Entitäten herstellt.

2.2 Wie sieht nun eine Ontologie aus? Das Problem der semantischen Heterogenität kann reduziert werden, wenn alle Begriffe, die eine Ontologie beschreibt, möglichst eine eindeutige und nicht-redundante Definition haben und weltweit gültig sind. [metamodel,2003]

Ein kontrolliertes Vokabular, die einfachste Ontologie, ist eine Liste von Begriffen, die von einer Registrierungsinstanz verwaltet wird. Wörterbücher und Lexika z.B. beschreiben die Begriffe informell eindeutig und werden allgemein für ein besseres Verständnis zwischen Menschen und Organisationen genutzt.

Die Taxonomie ist eine der ältesten und wissenschaftlichen Disziplinen in der Medizin und der Biologie. Mit Taxonomie (griech. Taxis=Ordnung,-nomia = Verwaltung) werden Gruppen von kontrollierten Vokabularien eines Themengebietes definiert und in eine hierarchische Beziehung gesetzt, um so ein Themengebiet möglichst präzise zu beschreiben und zu repräsentieren. Es gibt z.B. internationale Regelwerke zur Nomenklatur für die Zoologie (International Code of Zoological Nomenclature - ICZN).

Die Schemata von Datenbanksystemen bilden eine konzeptuelle Datenbeschreibungen in Form von Entity-Relationship-Modellen oder UML-Diagrammen. Sie bieten eine Beschreibung von Begriffen und ihren Beziehungen an, die direkt in eine Ontologie umgesetzt werden können. So kann z.B. eine zwischen den Klassen ‚Angestellter’ und ‚Projekt’ definierte Assoziation ‚arbeitet-in’ direkt in eine entsprechende semantische

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733563

Page 4: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Relation in einer zugehörigen Ontologie umgesetzt werden. Im Vergleich zu Ontologien sind aber die Beschreibungen konzeptueller Datenbankschemata eingeschränkter in Bezug auf die zur Verfügung stehenden sprachlichen Ausdrucksmittel.[Sure, 2004] Darüber hinaus sind konzeptuelle Datenbankschemata im allgemeinen nicht auf eine gemeinsame Nutzung durch verschiedene Benutzergruppen ausgerichtet, sondern vielmehr auf eine Beschreibung der Inhalte einer Datenbank. Ferner sind konzeptuelle Datenbankschemata typischerweise nicht Bestandteil des laufenden Systems.

Ein Beispiel für eine Ontologie, die Bestandteil des laufenden Systems ist, stellt die FOAF-Ontologie (Friend of a friend) dar, ein Projekt zur maschinenlesbaren Modellierung sozialer Netzwerke. Leute können hier über ein FOAF-Dokument-Format Angaben über eine Person veröffentlichen. Die FOAF-Dokumente beruhen auf einem spezifizierten FOAF-Vokabular, das mit der Ontologiesprache (RDF/OWL) beschrieben wird. Ausser der Abstraktion des FOAF-Vokabulars werden noch ein paar mathematische Regeln verwendet, die den FOAF-Entwurf unterstützen. Ähnlich wie die Webseiten können FOAF-Dokumente mit anderen FOAF-Dokumenten kombiniert werden und so eine zusammenhängende informative Datenbasis erzeugen (http://xmlns.com/foaf/0.1/).

Semantik Web-Ontologien bestehen in der Regel aus einer Taxonomie und einer Reihe von Inferenzregeln, anhand derer Maschinen logische Schlüsse ziehen können.

2.3 Gemeinsam genutztes Vokabular und die KonzeptualisierungenWie schon Benjamin Lee Whorf in seinen Beiträgen zur Metalinguistik und Sprachphilosophie ‚Sprache, Denken, Wirklichkeit’ erläuterte, ist unser Wahrnehmungsapparat ganz darauf eingerichtet, Bereiche von Phänomenen, die so selbsterklärend und normal sind, weil sie für unser alltägliches Leben keine besondere Rolle spielen, zu ignorieren [Whorf,2003]. Das führt dann dazu, dass das Vokabular für den Sprechenden einen Hintergrundcharakter hat. Nach Whorf ist hier die Übereinstimmung dieser Hintergrundcharaktere einer Sprache notwendig, um eine Kommunikation zu ermöglichen. In der Informatik unterstützen formale Ontologien die Kommunikation zwischen menschlichen und/oder maschinellen Akteuren und erleichtern den Austausch und das Teilen von Wissen in Unternehmen. Zur Reduktion der semantischen Heterogenität sind zwei Anforderungen zu stellen. Zum Einen ist die Einigung einer Gruppe von Anwendern auf die jeweiligen Begriffe und deren Zusammenhänge nötig. Zum Anderen die Einigung auf ein Vokabular, die den Verweis auf die Begriffe, also die Repräsentation der Konzepte, eindeutig identifzieren[DoJeKrie,2004].

2.3.1 KonzeptualisierungDie semantische Grundlage für die Kommunikation sind Konzepte [Trabant,1996][Ogden et al]. Ein Konzept ist eine gedankliche Vorstellung bzw. die subjektive Interpretation über ein reales Ding in der Welt. Die Gesamtheit aller Konzepte bilden mit den Symbolen eine Brücke zwischen der impliziten gedanklichen Vorstellung eines Weltbildes und des physikalischen expliziten Modells der Welt. Die Problematik liegt darin, dass die Zuordnung des Symbols auf den Gegenstand nicht mehr eindeutig ist. So kann das Symbol „Käfer“ sowohl dem Konzept „Auto“ als auch dem Konzept „Tier“ zugeordnet werden[K. Janowicz,2003]. Semantik ergibt sich aus der Verknüpfung eines Symbols mit einem Konzept, das etwas beschreibt. Eine Konzeptualisierung im Sinne von Gruber hat nun die Aufgabe, die Semantik im Umfeld der technischen Informationssysteme so eindeutig zu formulieren, dass kein Interpretationsspielraum übrig bleibt und trotzdem keine Semantik verloren geht. Problematisch ist aber, dass die natürliche Sprache keinen hinreichenden Zeichvorrat zur Verfügung bereitstellt, um alle denkbaren Konzepte so eindeutig zu benennen[DoJeKrie2,2004]. Wie kann nun die minimale ontologische Vereinbarung, die die Entwicklung einer Ontologie so wenig wie möglich einschränkt, um die Freiheit zur Spezifikation zu ermöglichen, erzielt werden? Um Homonyme und Synonyme auszuschließen, kann durch eine allgemein anerkannte Vereinbarung ein Name als

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733564

Page 5: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

eindeutige Referenz auf das Konzept verwendet werden. Eine solche Referenz ist z.B. ein Uniform Resource Locator (URL) wie sie in dem RDF-Konzept verwendet wird. Die ontologische Zustimmung beruht auf der Benutzung eines konsistenten Vokabulars[Gruber,93]. Eine ontologische Zustimmung kann man minimieren, wenn eine sehr schwache semantische Ontologie spezifiziert wird und nur die Begriffe eines Vokabulars definiert werden, die unbedingt notwendig sind für die Kommunikation. Das RDF-Konzept ist ein Beispiel für eine schwach spezifizierte Theorie.

2.3.2 Gemeinsam genutztes VokabularRDF verwendet URIs zum Identifizieren der Ressourcen und verknüpft sie so mit einer eindeutigen Definition. Allerdings können z.B. verschiedene RDF-Instanzen dieselben Sachverhalte in unterschiedlicher Weise ausdrücken. Mit RDF-Schema (RDFS) kann ein Vokabular erstellt werden, das Gruppen von verwandten RDF-Ressourcen und ihren Beziehungen zwischen diesen Ressourcen auf einer höheren Abstraktionsebene flexibel beschreibt. Gleichzeitig bestehen RDFS-Triples aus Klassen, Klasseneigenschaften und Werten, so dass aufgrund von Typeigenschaften die Eindeutigkeit von Sachverhalten sichergestellt werden kann. Mit RDFS kann ein domänenspezifisches Vokabular erstellt werden. Einen Abgleich von Aussagen verschiedener Domänen erfordert noch zusätzliche Axiome, wie z.B. subClassOf, disjointWith und Klassenbeschreibungen wie unionOf, intersectionOf usw., die von der Ontologiewebsprache OWL bereitgestellt wird.

Die sinnvolle Definition von Vokabularien, die allgemein von vielen verstanden und benutzt wird, muss kohärent und konsistent sein, damit mit diesen qualifizierte Suchanfragen durchgeführt werden können und Softwareagenten Informationen austauschen können. Die Agenten, die sich ein gemeinsames Vokabular teilen, müssen sich nicht die Wissensbasis teilen; jeder kennt Dinge, die ein anderer nicht kennt. Auch muss ein Agent, der einer Ontologie zustimmt bzw. verpflichtet ist, nicht unbedingt auf alle Fragen antworten, die man mit einem gemeinsam genutzten Vokabular stellen kann[Gruber,1993]. In dem das in der Ontologie definierte Vokabular benutzt wird, stimmt man mit einer Ontologie überein. Sie ist eine Garantie für Konsistenz aber nicht für die Vollständigkeit des verwendeten Vokabulars.

Aufgrund der natürlichen Umweltveränderungen entstehen auch zukünftig neue Begrifflichkeiten, die von Ontologien für bestimmte Aufgaben oder Repräsentationen aufgenommen werden müssen. Deshalb müssen Ontologien offen für Erweiterungen sein ohne dass eine Revision der existierenden Definitionen notwendig wird [Gruber,1993]. RDF-S und OWL-Full sind offen für weitere Vokabular-Definitionen. Das Hinzufügen von Vokabeln erweitert den Bereich der gemeinsam genutzten Vokabeln und kann dadurch die ontologische Zustimmung erhöhen. Um die Wiederverwendbarkeit von Ontologien zu steigern - die Erstellung einer Ontologie mit der Standardisierung der Terminologie ist sehr mühsam - haben sich verschiedene Top-level-Ontologien entwickelt, die sehr allgemeine Konzepte beschreiben. Ein Beispiel ist die EuroWordNet Top Ontologie, die die verschiedenen Sprachkonzepte der Europäischen Länder über eine sprachunabhängige Ebene abgleicht. Das Ziel von EuroWordNet ist eine multilinguale Datenbasis aufzubauen, die ein Vokabular für mehrere Sprachen bereitstellt. Dublin Core ist ein anderes Beispiel, das eine Menge von standardisierten Metadaten für die Veröffentlichung von Literatur beinhaltet. Sie stellt als Vokabular eindeutige URIs für die wichtigsten Metadatentypen zur Verfügung. Spezifizierte Metadaten-Vokabularien für die Beschreibung von Ressourcen wie z.B Autor, Datum, Inhalt etc. verbessern die automatische Suche und Abfrage von unstrukturierten Informationen und Dokumenten.Cyc-Ontologie (encyclopedia)ist ein kommerzielles Produkt, wobei die UpperOntologie, die Konzepte des Alltagswissen enthält, frei verfügbar ist. DOLCE ist eine weitere freiverfügbare Ontologie-Bibliothek von existierenden Ontologien.

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733565

Page 6: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

2.4 Die Spezifikation eines WissenskontextsDie Spezifikation eines Wissenskontext bedeutet, dass man sich gegenseitig darauf verständigen und einigen muss, welche Bedeutung die Entitäten haben, die den Inhalt einer Web-Informationsressource repräsentieren. Es haben sich in verschiedenen Gebieten verschiedene Ontologien entwickelt, die überlappende Informationen enthalten. Nach Jasper und Uschold [Jasper, Uschold, 1999] unterscheiden sich Ontologien nach dem Grad der Formalität und nach dem Maß der Definitionstiefe.

2.4.1 Grad der FormalitätDer Grad der Formalität bestimmt den Grad der semantischen Interoperabiltät, der Fähigkeit zur Zusammenarbeit heterogener Informationssysteme nicht nur syntaktischer, sondern auch inhaltlicher Art [W.Kuhn, 2005]. Die Formalität einer Sprache, die eine Ontologie repräsentiert, lässt sich in 4 Bereiche einteilen:

• Total informellEine Ontologie wird einfach in natürlicher Sprache beschrieben, viele Glossare passen in diese Kategorie.

• Semi-informellDie Ontologie wird in einer strukturierte Form mit einer natürlichen Sprache dargestellt, die die Mehrdeutigkeiten reduziert. Die Taxonomie z.B. ist ein Wortschatz, der in einer Generalisierungs-Spezialisierungs-Hierarchie strukturiert ist.

• Semi-formaleine semi-formale Sprache ist eine künstlich formal definierte Sprache, die die Beschreibung der Begriffe sowohl informell in einer natürlichen Sprache als auch formal in einer computer interpretierbaren Wissensrepräsentationssprache unterstützt. [FaFiRi,96]

- Eine Taxonomie, die mit einem Regelsystem implementiert ist, ermöglicht Wissen schnell und einfach in Regeln darzustellen. Beispiele sind Expertensysteme und Produktionssysteme.

- FramekonzepteFrames sind ein mögliches Modell zur Darstellung von Konzepten [Loenneker,2003]. Durch die Kombination der in den Frames enthaltenen Informationseinheiten (Framename, Slots und Filler) wird Wissen über die Konzepte repräsentiert. Es sind hier Klassenkonzepte bzw. Klassenframes gemeint. Einzelframes werden als „Instanzen von Klassenframes“ bezeichnet. Filler sind die sogenannten Standardwerte, die Slots einnehmen können. Beispiel: Klassenframe: Apfel Slots: Form, Farbe, Größe, Material, Geschmack, Filler: rund, rot, apfelgroß, Fruchtfleisch, süßsauer, Die Framekonzepte ähneln dem Klassenkonzept der objekt-orientierten Programmierung (OOP).

- Semantische Netzwerke Konzepte werden als Knoten, Relationen als Kanten visualisiert. Der Vorteil liegen darin, daß ein semantisches Netz die semantische Nähe zwischen Konzepten wiederspiegelt. Inhaltlich ähnliche Konzepte liegen nah aneinander, während unterschiedliche Konzepte durch eine Reihe von Zwischenknoten verbunden sind. Diese Eigenschaft ermöglicht einen besonders schnellen Zugriff auf die mit einer etwaigen Anfrage inhaltlich verwandten (assoziativen) Informationen.

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733566

Page 7: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

• Rigoros formalEine formale Sprache, die auf der Prädikatenlogik basiert, treibt den Standardisierungsprozess voran, ermöglicht die Entwicklung von Schlussfolgerungskalkülen, der gültige Eigenschaften von Mengen von Ausdrücken ableitet, sodass Fragen der Vollständigkeit und Korrektheit von formalen Spezifikationen überprüft werden können. Beschreibungslogiken (engl. description logics), sind eine Familie von Sprachen zur Wissensrepräsentation. Die meisten Beschreibungslogiken sind eine Untermenge der Prädikatenlogik erster Stufe, im Gegensatz zu dieser aber entscheidbar. Sie basiert auf dem Open World Prinzip, das einen Mangel an Wissen nicht unbedingt falsifiziert und negiert. Es geht von einer Information aus, die unvollständig spezifiziert ist. Das Open World Prinzip ist daher gut geeignet für die Beschreibung von Wissen, das sich iterativ erweitern kann [Drummond,Shearer,2006]. KIF (Knowledge Interchange Format) wurde entwickelt, um das Problem der verschiedenen Sprachen der Wissensrepräsentation zu lösen. Es basiert auf dem Prädikatenkalkül.

Je höher der Grad der Formalität einer Sprache ist, desto stärker ist der Standardisierungsprozess[Fensel,1994], desto strukturierter ist die Information und desto nützlicher kann eine Ontologie sein[Guarino,1998].

2.4.2 Das Ausmaß der DefinitionstiefeDas Ausmaß der Definitionstiefe ist von dem Zweck abhängig, die eine Ontologie erfüllen soll. Es gibt kleinere leichtgewichtige Ontologien, die keine komplexen Strukturen enthalten, wie z.B. Produktkategorisierungen. Die schwergewichtigen Ontologien können sich aus mehreren kleinen leichtgewichtigen Ontologien durch „Merging“ bilden oder es sind umfangreiche Ontologien, wie z.B. die Toplevel-Ontologien DOLCE oder CyC, die viele komplexe Schlussfolgerungen unterstützen müssen.

Es werden kurz Webstandards vorgestellt, die Wissen implementierungsabhängig von einer Programmiersprache darstellen. Die Sprachen werden anhand der Ausdrucksstärke, der Inferenzmächtigkeit und der Entscheidbarkeit verglichen. [Chrocho, Pérez, 2000],[W3C,2004].

• XML: (eXtensible Markup Language) stellt eine Syntax für strukturierte Dokumente zur Verfügung, nutzt aber keine semantische Eingrenzung der Bedeutung dieser Dokumente.

• XML Schema ist die Sprache, um die Struktur von XML Dokumenten festzulegen und erweitert XML auch um die Datentypen.

• RDF: (Resource Description Framework) ist eine Datenmodell für Resourcen und Relationen zwischen diesen. Es stellt eine einfache Semantik für das Datenmodell zur Verfügung, die in XML repräsentiert werden kann.

• RDF Schema: stellt ein Vokabular zur Beschreibung der Eigenschaften und Klassen von RDF Resourcen mit einer Semantik für verallgemeinernde Hierarchien solcher Eigenschaften und Klassen bereit.

• DAML+OIL: (Ontology Inference Layer) kann als eine Ontologie-Infrastruktur für das SemanticWeb betrachtet werden. OIL basiert auf Konzepten, die in Beschreibungslogik und frame-basierten Systemen entwickelt wurde. Sie ist kompatibel mit RDFS. Sie ist somit entscheidbar und unterstützt effizientes Reasoning. [Fensel et al,2000]

• OWL: Die Web Ontology Language ist eine Spezifikation des W3C und basiert historisch auf DAML+OIL auf. Sie fügt mehr Vokabeln zur Beschreibung von Eigenschaften und Klassen hinzu (Disjunktheit, Kardinalität, Äquivalenz etc). OWL hat drei Untersprachen mit zunehmender Ausdrucksstärke:

o OWL-Lite dient zum schnellen und einfachen Erstellen von Taxonomien und hat eine geringere formale Komplexität als OWL-DL.

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733567

Page 8: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

o OWL-Description Logic(-DL) entspricht dem OIL, und unterstützt diejenigen Nutzer, die die maximale Ausdrucksmächtigkeit bei gleichzeitiger Erhaltung der Berechenbarkeit, alle Schlussfolgerungen sollen garantiert berechenbar und entscheidbar sein. OWL-DL entspricht der Beschreibungslogik.

o OWL-FULL ist die ausdrucksmächtigste logische Sprache, die prädikatenlogische Ausdrücke höheren Grades ermöglichen. Sie erlaubt es einer Ontologie die Bedeutung von vordefiniertem RDF- bzw. OWL-Vokabular zu erweitern allerdings ohne eine Garantie der Verarbeitbarkeit.

Mehr über die Ausdrucksmächtigkeit von semantischen Markup-Sprachen erfährt man von Yolanda Gil und Varun Ratnakar [Gil,Ratnakar,2000] und von Oscar Corcho und Asunción Gómez-Pérez[Chrocho, Pérez, 2000].

2.5 Anwendungsgebiete für Ontologien: Die Vorteile von Ontologien liegen zum einen in dem einheitlichen Sprachgebrauch, der den Datenaustausch zwischen verschiedenen Akteuren unterstützt. Zum anderen sind sie maschinenlesbar und verarbeitbar und ermöglichen die Darstellung komplexer Beziehungen zwischen Objekten. Die Anforderungen an die Formalität und Ausdrucksmächtigkeit einer Ontologie sind von jeweiligen Anwendungsgebiet abhängig. Nach Jasper lassen sich die Anwendungsszenarien für Ontologien in 4 klassische Gruppen gliedern:

• Kommunikation: Ontologien reduzieren die semantischen und terminologischen Begriffsverwirrungen und ermöglichen dadurch ein gemeinsames Verständnis und gemeinsame Kommunikation zwischen Menschen mit ihren verschiedenen Ansichten von Konzepten. Ontologien können als ein normatives Modell eingesetzt werden, in dem z.B. die unterschiedlichen Begrifflichkeiten für Geschäftsaktivitäten und –objekte vereinheitlicht werden, um eine automatische Zusammenführung von Geschäftsprozessen zu ermöglichen. Ontologien können Beziehungsnetzwerke herstellen, ein Beispiel ist die FOAF-Ontologie, die soziale Netzwerke ermöglicht und so eine Zusammenarbeit zum hierarchiefreien Wissensaustausch und der Wissensgenerierung über das Internet als das „Mitmach-Netz“ beitragen. Die Integration von Wissen, indem Ontologien benutzt werden, kann an dem ffPoirot-Beispiel, eine mehrsprachige Anwendung zur Bekämpfung von Mehrwertsteuer-Betrug (www.ffpoirot.org), dargestellt werden, wo Anwender eigene Erfahrungen zu finanziellen Problemen hinzufügen oder Wissen dazu abfragen können.

• Technische Systementwicklung:Standardisierungen im Umfeld der Informations- und Kommunikationstechnologie sind erforderlich, um die Kompatibilität und Interoperabilität zwischen verschiedenen Systemen zu erreichen. So ist die Kompatibilität der Daten für Zwecke, die auf Vergleiche beruhen, z.B. bei Klassifikationen, notwendig, um Redundanzen und unötige mühesame Arbeit zu reduzieren[ISO/TC]. Mit Ontologien wird ein standardisiertes Grundvokabular definiert, welches später als Basis für die Anforderungsspezifikation und für die Entwicklung von Software dient. Neben der Wiederverwertbarkeit und Wartbarkeit unterstützt dieses Verfahren auch die Dokumentation der SW. Die unbeschränkte Wiederverwendbarkeit von Ontologien ist das große Ziel vieler Top-Level-Ontologien, um so die Zuverlässigkeit und Konsistenz zu erhöhen. Ontologien sind offen für neue Konzepte und können leicht erweitert werden[Uschold,1996].

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733568

Page 9: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

• InteroperabilitätZwei Applikationen sind interoperabel, wenn sie die terminologische Semantik in ihren korrespondierenden Konzepten gemeinsam nutzen und teilen [Grüninger,2005]. Sollen zwei Programme (z.B. Web-Suchmaschinen oder Software-Agenten) miteinander kommunizieren, so müssen sie entweder selbst die Interpretationsvorschrift für die Daten in sich tragen (sind also datenabhängig) oder aber sie liefern diese in Form von Metadaten aus einer beiden Seiten zugänglichen Ontologie mit. Das Knowledge-Interchange-Format (KIF) wurde entwickelt, um den automatisierten Wissensaustausch zwischen verschiedenen wissensbasierten Systemen zu ermöglichen. Viele Ontologiesprachen bauen auf dem KIF-Format auf oder sind kompatibel zum KIF-Format, sodass verschiedene Wissensspezifikationen ( Ontologien) auf verschiedene (relationale, objektorientierte, deduktive…) Datenbank-Schemata mittels KIF als Mediator übertragen werden konnten[Guarino,1998].

• Automatisches Schließen (Information Retrieval)Der Nachteil klassischer Information Retrieval Ansätze ist, dass eine rein syntaktische Suche nach Begriffen stattfindet, ohne dabei die Bedeutung der Wörter innerhalb der einzelnen Dokumente zu berücksichtigen. Durch die Benutzung der eindeutig spezialisierten Begriffe einer Ontologie für die Suchanfrage, z.B. durch den Einsatz von linguistischen Ontologien wie EuroWordNet wird das Ergebnis der Suche eindeutiger und nicht so diffus. Beim automatischen Schließen können Programme logische Schlüsse schon aufgrund der bekannten Ableitungsregeln der formalen Ontologie ziehen – diese müssen also nicht stets von Neuem übermittelt werden. So steht z.B. hinter der Preisfeststellung für die Deutsche Bahn ein Regelwerk, das dem Kunden unbekannt ist, weil es wahrscheinlich ziemlich kompliziert ist. Ein Reasoner, der deklarative Regeln und automatische Schlussverfahren einsetzt, würde es ermöglichen, a) dieses Regelwerk dem Kunden mitzuteilen und b) die Preisfestlegung dem Kunden zu erklären. Der Kunde hat so die Möglichkeit, mehr Kontrolle über die Auswahl von günstigen Zugverbindungen zu haben [Bry,2005].

3.0 Die Rollen von Ontolgien bei der Informationsintegration

Im letzten Abschnitt wurden die Vorteile der ontologiebasierten Informationsnutzung erläutert. In diesem Abschnitt werden die drei Rollen beschrieben, die Ontologien einnehmen können:

• Ontologien werden hauptsächlich zur Repräsentation und Visualisierung von zum Teil unterschiedlich strukturierten Informationen eingesetzt

• Ontologien können als ein Query–Modell eingesetzt werden, das die Suche und das Browsing von Informationen vereinfacht, indem die Struktur der Ontologie genutzt wird

• Ontologien werden auch als Verifikationsmodell genutzt, denn durch die Spezifikation wird die Softwareentwicklung mit Ontologien konsistent

3.1 RepräsentationsarchitekturenEine der Hauptrollen von Ontologien ist die Repräsentation ihrer Instanzen. Sie dienen als Informationsquellen, die ihre Instanzen als Ergebnis von Suchanfragen an den Nutzer liefert. Es gibt drei verschiedene Architektur-Ansätze, wie die zum Teil unterschiedlich strukturierten Informationsquellen( HTML- Seiten, Datenbanken, Textdateien) mit einer einheitlichen Semantik für den Nutzer dargestellt werden können: der Single-Ontology-Ansatz, der Multiple-Ontology-Ansatz und den Hybrid-Ansatz.

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 56733569

Page 10: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

3.1.1 Der Single-Ontology - Ansatz: Der Single-Ontologie-Ansatz benutzt eine einzige globale Ontologie und stellt ein gemeinsam zunutzendes Vokabular für ein bestimmtes Fachgebiet bereit. Alle integrierten Informationsquellen in einem System müssen ihre Informationen mit dem einheitlichen Vokabular der globalen Ontologie präsentieren. Dies gelingt nur, wenn die zu übersetzenden Informationen eine nahezu gleiche Sicht auf das zu präsentierende Fachgebiet hat, weil sonst der Gültigkeitsbereich der Ontologie verletzt wird und so wieder Homonyme und Synonyme entstehen können. Aufgrund des einheitlichen Vokabulars ist der Vergleich der Informationsressourcen sehr einfach, hat aber den Nachteil der engen Kopplung bezüglich der ontologischen Übereinstimmung. Es ist fraglich, ob nicht trotzdem bestimmte terminologische Fehlanpassungen, wie die Hyponyme, Hyperonyme auftreten können[sekt(422SOA),2003]. Änderungen in der Informationsressource ziehen Korrekturen in der globalen Ontologie nach sich, wodurch die Skalierbarkeit der Ontologie, also wie einfach das Integrationssystem mit neuen Informationsquellen erweitert werden kann, leidet. Die Wiederverwendung von Ontologien wird nicht unterstützt. Ein allseits bekannter Ansatz der globalen Ontologie-Integration ist SIMS (Search In Multiple Sources), das 1993 erschien und den Zugriff und die Integration verschiedener dynamischer Informationsquellen über einen Wrapper/Mediator ermöglicht[Buccella,2005]. Suchanfragen werden mit einer SQL-ähnlichen Sprache (LOOM) mit den Begriffen der globalen Ontologie durchgeführt, die zunächst in das Konzept der ursprünglichen Informationsquelle übersetzt werden müssen. Anschließend wird der Queryplan generiert, wobei die Suchanfrage in 2 Unteranfragen zerlegt wird, deren Ausführungsplan noch optimiert wird.

3.1.2 Multiple-Ontologie-AnsatzDie Inflexibilität bei Informationsänderungen, die zu enge Kopplung und mangelnde Wiederverwendbarkeit von Ontologien in Single-Ontology-Ansätzen führten zu der Entwicklung des mehrfachen-Ontologie-Ansatzes, wo jede Ressource durch seine eigene Ontologie repräsentiert wird. OBSERVER (Ontology Based System Enhanced with Relationship for Vocabularity heterogeneity Resolution) ist ein Ansatz, der viele Informationsquellen über ihre speziellen Ontologien verwaltet. Die Architektur basiert auf Wrappers, Ontologie-Server und einem Inter-Ontologie-Relationship-Manager (IRM). Jede Ressource kann jede beliebige Ontologiesprache zur Repräsentation verwenden, ohne sich auf ein gemeinsames Vokabular binden zu müssen. Dies vereinfacht zwar die Skalierung des Systems - das Hinzufügen einer zusätzlichen Ressource hat keine Änderungen des gesamten Systems zur Folge - dafür muss aber der Vergleich der Ressourcen sowohl auf der semantischen als auch auf der terminologischen Beschreibungsebene durchgeführt werden. Die Auswertung der Ontologievergleiche wird vom IRM durchgeführt, der die semantischen Beziehungen zwischen den verschiedenen Ontologien mit den Begriffen der Synonyme, Hyponyme, Hypernyme, Abdeckung, Disjunktheit und Überlappung etc. identifiziert [Buccela,2005]. Die Suchanfragen, die in Begriffen der lokalen Ontologie formuliert sind, müssen in die Anfragesprache aller anderen beteiligten lokalen Ontologien übersetzt werden. Der 1:1-Mapping-Ansatz lässt die Komplexität des Ontologie-Mapping auf O(n2) steigen, wobei n die Anzahl der Ontologien sind[sekt422soa,2003]. Der Mangel eines gemeinsam genutzten Vokabulars erhöht die semantische Heterogenität, die eigentlich mit Ontologien beseitigt werden sollte.

3.1.3.Hybrid-AnsatzDieser Ansatz verbindet die beiden anderen Ansätze zur Beschreibung von Informationen. Jedem Informationssystem wird seine eigene lokale Ontologie zugeordnet, wobei alle lokalen Ontologien auf einem gemeinsamen globalen Vokabular basieren. Das Vokabular gibt die allgemeinen Begriffe systemweit vor, die dann für die einzelnen lokalen Ontologien entsprechend den Konzeptualisierungen zu komplexen Begriffen kombiniert werden. Die Flexibilität und Skalierbarkeit wird durch die lokalen Ontologien unterstützt, während das globale Vokabular als „Lingua Franca“ die Vergleichbarkeit der Applikationsontologien gewährleistet. Werden die verschiedenen

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335610

Page 11: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Hybridansätze vernetzt, muss auch wieder ein ontologisches Mapping durchgeführt werden. Für die Integration und das Mapping der Ontologien wird ein Werkzeug bereitgestellt, dass die Informationen aus den heterogenen Informationssystemen integriert und kombiniert. Das auf den Hybrid-Ansatz basierende System COIN hat eine wrapper-mediatorbasierte Architektur. Wrapper kapseln die Informationssysteme, um eine einheitliche Schnittstelle auf beliebige Informationssysteme zu bieten. Die Mediatoren müssen die Heterogenitätskonflikte beseitigen und kombinieren bzw. integrieren die Informationen[Wache,2003]. Nachteilig ist, dass Ontologien nicht wiederverwendet werden können, da sie erst dem globalen Wortschatz angepasst werden müssen. Bei dem agentenbasierten System KRAFT oder Inflosleuth wird die lose Kopplung und damit die Wiederverwendung von Ontologien unterstützt, indem Agenten den Austausch der Daten und ihre Konsolidierung im dynamisch verteilten System übernehmen [Buccela,2005]. Die Suchanfragen in einem zentralen mediatorbasierten System, die in lokalen Ontologien erstellt werden, müssen wie beim OBSERVER für die unterschiedlichen Ressourcen passend umgeschrieben werden.

3.2 Query-ModellDas Vokabular, das von den Ontologien bereitgestellt wird, dient als ein stabiles konzeptuelles Interface für Datenbanken, welches unabhängig von den Datenbank-Schematas ist. Die Ontologiesprachen sind ausdrucksstark genug, um die Komplexität von Abfragen in entscheidungsunterstützenden Anwendungen zu verarbeiten [Buccela,2005]. Suchanfragen werden an ein mediatorbasiertes Schema gestellt, das eine Ontologie ist, die den Wissensbereich eines Systems beschreibt. Wenn Ontologien als ein Querymodell benutzt werden, dann können Nutzer die Suchanfragen mit den Begriffen der globalen Ontologie, wie z.B. bei SIMS, stellen, ohne sich um die Begrifflichkeiten oder die Sprache zu kümmern, die die verteilten Informationsquellen enthalten. Deshalb können Suchanfragen in einer „high-level“-Sprache, wie z.B. Loom oder einer SQL ähnlichen Sprache geschrieben werden. Diese Queries enthalten keine Informationen, die auf die Quellen hinweisen, die relevant für ihre Ausführung sind oder wo sich die Quellen befinden. Das System reformuliert die Suchabfragen in Unterabfragen entsprechend für jede Informationsquelle.

3.3 VerifikationJede Informationsquelle ist eine Instanz eines Ontologiesystems. Eine Ontologie kann Auskunft über Ressourcen geben, wie oft und durch wen sie aktualisiert wurde. Solche Informationen können den Zugriff auf Instanzen von Ontologien überprüfen und steuern. Der Austausch von semantik-erhaltenden Informationen erfordert eine überprüfbare Methode, die die logisch equivalenten Konzepten in den unterschiedlichen Ontologien erkennt und diese dann in die Zielontologie überführt. Die Korrektheit und die Überprüfung dieser Transformation ist selbst mit der ausdrucksstärksten Ontologiesprache problematisch [Calvanese,2001], weil das Ergebnis des Mappings der unterschiedlichen Ontologien stark von der Übereinstimmung der Konzepte abhängt. Die Korrektheit einer Entscheidung bei der Suche einer Übereinstimmung, z.B. ob das Ergebnis einer lokalen Suchanfrage eine Untermenge von dem Ergebnis einer globalen Suchanfrage ist, das auch als das Problem des Query-Containment [Calvanese,1998] bezeichnet wird, ist die Aufgabe der Verifikation. Mit Ontologien können z.B. Software-Agenten überprüfen, ob die erhaltenen Informationen die gewünschten Informationen sind und mit Inferenzregeln die Kohärenz der Ontologie checken[dHelicFensel,2001]. Die Qualität einer Verifikation hängt stark von der Vollständigkeit des Vokabulars der beteiligten Ontologien und von ihrem Formalisierungsgrad ab.

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335611

Page 12: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

4.0 Ein Framework für die Informationsnutzung

Es wird ein einheitliches und ausdrucksstarkes Framework gesucht, das in der Lage ist, verschiedene Informationsressourcen wie HTML-, XML-, RDF-, RDFS- und andere Dateien mit Hilfe von Tools zu veröffentlichen, diese abzufragen, zu interpretieren und zu integrieren. Die meisten Architekturen basieren auf dem Hybridansatz, weil mit dem einheitlichen und standardisierten Vokabular die Suchanfragen, ihre Reformulierungen, die Übersetzungen zwischen den Ontologien und die Verifikation wesentlich vereinfacht wird. Die Infrastruktur basiert auf drei Schichten:

• Die unterste Ebene hält die Daten, Metadaten und Ressourcen bereit, die HTML, XML oder RDF enthalten können.

• Die mittlere Ebene stellt die Middleware-schicht, die bestimmte Dienste bereitstellt [Koffina et al,2005], die

o Mapping-Regeln zwischen XML und RDF und anderen Sprachen ermöglicht, o die die Konformität dieser Mappings überprüft, o die Reformulierungen der Suchanfragesprachen für die verschiedenen

Informationsquellen bereitstellt und o diese Suchanfragen miteinander kombiniert.

• Die oberste Ebene stellt für diese Dienste die wiederverwendbaren standardisierten und somit stabilen Ontologien und das globale Vokabular zur Verfügung.

Ein Framework für die ontologiebasierte Informationsnutzung sollte 2 Methoden bereitstellen: a) die Gewinnung von inhaltsbasierten Informationen aus verteilten Ressourcen

(Information Retrieval)und b) b) die Übersetzung der Konzeptualisierungen verschiedener Ressourcen.

Die minimale ontologische Vereinbarung (commitment) wird garantiert, in dem z.B. für das Reasoning mit einem globalen kontrollierten Vokabular durchgeführt wird (die Reduktion auf die Syntax). Die Beschreibungen der Konzepte in den Ontologien werden mit den formalen logischen Begriffen und dem kontrollierten Vokabular ausgedrückt (Reduktion auf die Logik)[StuckenschmidtVanHarmelen,2003].

5.0 Der Übersetzungsprozess und Ontologie-Alignment

Das ontologische Übersetzungsproblem erscheint, wenn wir Ontologien oder Teile davon mit entsprechenden Tools oder Sprachen wiederverwenden wollen, die sich von der verfügbaren Ontologie unterscheiden [Gruber,1993]. Die verschiedenen Sprachen und Tools sind unterschiedlich in ihrem Grad der Formalität und ihrer Ausdrucksmächtigkeit(siehe dazu 2.5). Außerdem haben sich auch viele verschiedene Ontologien entwickelt, die entweder in den klassischen Ontologiesprachen wie CycL, Flogic, KIF, LOOM oder Ontolingua implementiert sind oder in den Markup-Sprachen für das Semantik Web, wie z.B. DAML+OIL, OWL, RDF, RDFS, XOL etc.[Corcho,2005]. Um die Interoperabilität zwischen den semantischen (Web-) Applikationen zu gewährleisten, wird eine Mediation zwischen diesen verschiedenen Wissens-Repräsentationen benötigt. Auch für das Querying und für die Datenintegration ist ein Mappingprozess, der die Beziehungen zwischen den beteiligten Ontologien beschreibt oder ein Merge, der eine neue Ontologie aus den Quellressourcen erstellt, notwendig. Man kann drei Phasen (in zeitlicher Ordnung) unterscheiden[sekt422soa,2003], wobei nicht alle Phasen in jedem Mapping-Tool notwendig und manche Phasen nur optional sind:

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335612

Page 13: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

1. Ontologien importieren Die in verschiedenen Sprachen spezifizierten Ontologien werden in das Mapping-Tool importiert, das dann das Mapping spezifiziert.

2. Ähnlichkeiten finden Viele Systeme benutzen einen Match-operator, um semi-automatisch Ähnlichkeiten zwischen den Schematas oder Ontologien zu finden. Es werden Merkmale bzw. Attribute von Entitäten gesucht und der Suchraum kann eingeschränkt werden, so dass nur sinnvolle Entitäten für einen Vergleich zugelassen werden.[Sure et al,2006]

3. Mapping/Merge spezifizieren Nach dem Finden der Ähnlichkeiten zwischen Ontologien müssen diese spezifiziert werden, der manuell, eventuell auch mit einem Hilfstool wie z.B. PROMPT durchgeführt wird. PROMPT ist ein Tool für den interaktiven Merging-Prozess, indem eine koherente Ontologie erzeugt wird, die die Versionen der Ursprungsontologien enthält. Meistens finden noch iterative Rücksprünge zur vorherigen Phase statt, weil ein Entitätenpaar normalerweise mehrere Ähnlichkeitswerte besitzt. Tools können präzisere Ähnlichkeitsmessungen durch eine simple Durchschnittsbildung oder durch komplexe Aggregierungsfunktionen mit Gewichten für jede einzelne Ähnlichkeit durchführen.

5.1 Ontologie-AligningVerändert man die originalen Ontologien nicht, impliziert dies, dass nur ein Teil der Ontologie-Integration durchgeführt werden kann, weil große Differenzen die Adaption der Ontologien erfordert. Wenn zwei Ontologien verbunden werden durch ein Ontologie-Aligning, dann bleiben die ursprünglichen Ontologien mit einer zusätzlichen Anzahl von Links erhalten, eine Sicht, die auch als bridge ontology bezeichnet wird und die eine gegenseitige Wiederverwendung der Informationen in den Ontologien erlauben[sekt422soa,2003]. Je höher der Grad der Wiederverwendbarkeit des gemeinsam genutzten Vokabulars und der Ontologien ist, um so mehr ist eine semantikerhaltende Integration von Informationen möglich.

6.0 Ontologie-Engineering

Klassische Entwicklungsmethoden für wissensbasierte Systeme sind meistens zentralisiert in ihrem Wissenssystem selbst. Im Gegensatz dazu versucht das Ontologie-Engineering in einem unvollständigen und sich laufend änderndem System zu strukturieren. Wünschenswertes Ziel ist es, dass Agenten, Webservices und ontologie-basierte Peer-to-Peer-Systeme mit Ontologien arbeiten, die alle sich ein gemeinsames Vokabular teilen. Um dieses Ziel zu erreichen sollte eine strukturierte Entwicklungsmethode für Ontologien die Entwicklung von gemeinsam genutzten und auf Gegenseitigkeit beruhende Übereinstimmung der benutzten Ontologien innerhalb und zwischen den Teams, die Weiterentwicklung der existierenden Ontologien durch andere und die Wiederverwendbarkeit von Ontologien in anderen Ontologien und Applikationen ermöglichen [Blazquez,1997?][ LóPéSierra, 1999].

Die bekanntesten Entwicklungsmethoden, wie z.B. die von Uschold & Gruninger 1996, beginnen alle mit der Identifikation des Zwecks und des Einsatzbereichs sowie dem Aufbau der Ontologie durch Erfassung und Klassifizieren von Konzepten, formale Kodierung und Integration von existierenden Ontologien mit iterierender Evaluation und Dokumentation. Nach der Erfassung und Strukturierung des Wissenkontexts schlägt Uschold die Kodierung in eine formale Sprache vor. Um eine minimale Kodierungsabweichung zu erreichen, die die Konzeptualisierung auf dem Wissenslevel unabhängig von der symbolischen Kodierung erfordert [Gruber,1996], wird in dem „METHONTOLOGY“-Framework[Gómez-Pérez et al,1997], das eine Definition und Standardisierung eines Ontologie-Lebenszyklus als auch die Methoden und Techniken für ihre Entwicklungsarbeit bereitstellt, noch eine Schicht (intermediate representations) eingefügt, die es dem Ontologie-Entwickler ermöglicht, sich ganz auf die

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335613

Page 14: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Konzeptualisierungen des Problembereichs zu konzentrieren, ohne Rücksicht auf die Implementierungssprache zu nehmen. Die Implementierung wird anschließend automatisiert mit einem Übersetzer in die verschiedenen Sprachen durchgeführt. So kann mit kompetenten Fragen (competency questions), die Anforderungen für die ontologiebasierte Anwendung definiert und prototypische Instanzen für eine Testmenge, die Evaluierung auf dem Wissenslevel durchgeführt werden und die Benutzbarkeit einer Ontologie verbessert werden [Blazquez,1997?].

7.0 Fazit:

Ontologien sind im World-Wide Web inzwischen alltäglich geworden. Die Ontologien im Web reichen von umfangreichen Taxonomien, die die Webseiten kategorisieren, solche wie Yahoo z.B., über online frei verfügbare Nachschlagewerke, wie z.B. Wikipedia bis hin zu Produktkategorien für den Verkauf, wie es z.B. Amazon.com anbietet [Noy,McGuinnes, 2001]. Es haben sich Initiativen gebildet, wie z.B. die Standard Upper Ontology Working Group (SUO), die einen Standard für Upper-Ontologien entwickeln, um die Dateninteroperabilität, Informationssuche und Retrieval, automatisierte Schlussfolgerungen durch Inferenzen und die natürliche Sprachenverarbeitung in Programmen zu ermöglichen und zu unterstützen. Die Standardisierung des Inhalts von Ontologien, wie sie Upperlevel-Ontologien bereitstellen, sind enorm wichtig für die Produktion von benutzbaren Ontologien hinsichtlich der Integrität und Konsistenz, weil sie wiederverwendet und innerhalb von Applikationen eingesetzt werden können. Damit Ontologien ihre Rollen im semantischen Web erfüllen können, sind die vom WWW Consortium (W3C) empfohlenen Datenmodelle RDF, RDFS und OWL weit verbreitet eingesetzt worden. Mit dem standardisierten Vokabular von RDFS /OWL konnte man das Problem der semantischen Heterogenität reduzieren. Es gibt bereits bereits einige praktische Anwendungen, die mit Einsatz von Techniken die Modellierung von Ontologien und die Wissensintegration, wie z.B. Protégé oder OntoStudio, erlauben. Diese Anwendungen haben sich allerdings noch nicht zu einer Killerapplikation im semantischen Web durchsetzen können. Die Evolution der ontologiebasierten Anwendungen, die Modellierung von Ontologien, Verfahren zum Alignment zwischen verschiedenen Ontologien wie auch die Reduzierung des Overheads für die Spezifikation von Metadaten sind nach wie vor die Schwerpunkte der heutigen Forschung [Jahresbericht,2006].

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335614

Page 15: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Glossar

Aligning Ontologien: Ontologie-Aligning spezifiziert, wie die Konzepte/Klassen in den verschiedenen Ontologien logisch in Beziehung stehen. Das heisst, dass die originalen Ontologien nicht verändert werden, aber zusätzliche Axiome beschreiben die Beziehungen zwischen diesen Konzepten. Wenn man die ursprünglichen Ontologien unverändert lässt, impliziert das, dass nur ein Teil der Integration durchgeführt werden kann, weil große Differenzen eine Anpassung der Ontologien erfordern würden. Das Konzept ist sehr ähnlich mit dem Ontologie-Mapping, ist aber etwas allgemeiner : zwei Ontologien können angepasst werden, wenn ein Ontologie-Mapping erzeugt wird. [sekt422soa,2003]

Closed World Prinzip: Das Closed World Prinzip beruht auf der Annahme zur Weltabgeschlossenheit bei der Modellierung von Sachverhalten. Alles, was nicht explizit als wahr bewiesen werden kann, wird als falsch und daher nicht ableitbar und nicht berechenbar bewertet. Alle Prädikate, die nicht in berechenbarer Zeit beweisbar sind, werden negiert.[ http://en.wikipedia.org/wiki/Closed_world_assumption]

Homonym: Ein und derselbe Begriff kann mehrere Bedeutungen haben, wie z.B. das Wort „Tau“, das sowohl ein „Seil“ als auch morgendlichen „Niederschlag“ bedeuten kann.

Hypernym: ein Begriff ist mehr verallgemeinernd als ein anderer. Zum Beispiel ist die Bedeutung von „Person“ allgemeiner als die von „Angestellter“. Die Hyperonymie-Beziehung ist nur für Substantive definiert.[Sure,2004] Hyponym: Ein Begriff ist weniger verallgemeinernd als ein anderer Begriff. Dies kann den Gültigkeitsbereich bei einer Integration einer Ontologie verletzen.

Killerapplikation: Eine Killerapplikation is, wie Mr.Gates sagt, „ a popular application“. Killerappliaktionen kann man in 2 Kategorien klassifizieren: entweder erfüllt die Applikation den gerade notwendigen Bedarf für den Benutzer besonders bemerkenswert und ungewöhnlich gut, oder die Software selbst produziert einen Bedarf, der nur von ihr erfüllt werden kann. Napster ist so ein Beispiel für eine Killerapplikation, die in die zweite Kategorie fällt. Niemand hat in den frühen 90zigern erwartet, dass Musik im Internet gemeinsam genutzt und geteilt werden kann. Napster hat den Bedarf erzeugt und der Bedarf ist bis heute vorhanden. [Katz’s Web, June 2003]

Kohärenz: Eine Ontologie soll kohärent sein, so dass Inferenzen gültig sind. Die definierten Axiome sollten logisch konsistent sein. Kohärenz soll auch in den Konzepten vorhanden sein, die informell beschrieben werden, wie die in der natürlichen Sprache geschriebenen Dokumentationen und Beispielen. Wenn eine Ausage, aus der man Schlussfolgerungen mit Axiomen ziehen kann, widersprüchliche Definitionen oder Beispiele informell gegeben werden, dann ist die Ontologie inkonsistent.

Leichtgewichtige Ontologie Leichtgewichtige Ontologien sind simple taxonomische Strukturen von Primitiven(atomaren Begriffen) oder zusammengesetzten Begriffen mit assoziierten Definitionen. Sie sind kaum axiomatisiert, da die sinngemäße Bedeutung der Begriffe mehr oder weniger von allen in der Gemeinschaft bekannt ist. Deshalb kann eine Ontologie auf strukturelle Beziehungen innerhalb der relevanten Begriffe eingeschränkt werden [Oberle, 2005]. Zu den leichtgewichtigen Sprachen zählen, RDF-S/OWL-Lite.

Mapping: Ein ontologiebasiertes Mapping M ist eine deklarative Spezifikation einer semantischen Überlappung zwischen zwei Ontologien Os und OT. Die Korrespondenz zwischen verschiedenen Entitäten zweier Ontologien werden typischerweise mit einigen formulierten Axiomen in einer speziellen Mapping-Sprache ausgedrückt. Mappings können unidirektional sein, die spezifiziert, wie Begriffe in einer Ontologie mit Begriffen

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335615

Page 16: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

der anderen Ontologie ausgedrückt werden, oder bidirektional, die die Spezifizierung in beiden Richtungen erlaubt.

Mapping Language: Die Mapping-Sprache ist die Sprache, die das Ontologie-Mapping M repräsentiert. Es ist wichtig zu unterscheiden zwischen einer Spezifikation der Ähnlichkeiten von Entitäten zwischen Ontologien und eines aktuellen Ontologie-Mappings. Die Spezifikation der Ähnlichkeiten zwischen Ontologien beruht auf Vertrauen, während ein Ontologie-Mapping die Relationenen zwischen den Entitäten der Ontologien spezifiziert. Das ist eine exakte Spezifikation und typischerweise weit mächtiger als eine simple Ähnlichkeitsmessung. Mapping-Sprachen erlauben oft eine beliebige Transformation zwischen Ontologien, meist wird ein regelbasierter Formalismuns benutzt.

Mapping Pattern: Ein Mapping Pattern kann als eine Vorlage für Mappings, die sehr häufig auftreten, betrachtet werden. Pattern können einfach aber auch sehr komplex sein, die Substrukturen von Ontologien erfassen, die in irgendeiner Art in Beziehung stehen.

Matching: Ein Ontologie-Matching wird als ein Prozess definiert, der Ähnlichkeiten zwischen zwei Ontologieressourcen entdeckt. Das Ergebnis einer Matching-Operation ist eine Spezifikation von Ähnlichkeiten dieser beiden Ontologien. Meist wird dafür ein Match-Operator benötigt. Jedes Schema-Matching oder Ontologie-Matching-Algorithmus kann für die Implementierung eines Match-Operators benutzt werden.[sekt422soa,2003]

Mediation: Ontologie-Mediation ist ein Vermittlungsprozess, um Unterschiede zwischen heterogenen Ontologien aufzulösen, damit eine Interoperation zwischen den Applikationen, die diese Ontologien verwenden, erreicht werden kann.

Merging: Merging erzeugt eine aus zwei oder mehreren Ontologieressourcen neue Ontologie. Die neue Ontologie vereinigt und ersetzt in der Regel die originalen Ontologieressourcen.

Minimale Kodierungsabweichung: Die Konzeptualisierung soll auf dem Wissenslevel spezifiziert werden, ohne abhängig von der symbolischen Kodierungsebene zu sein. Eine Kodierungsabweichung erfolgt, wenn eine Sache repräsentiert wird, die nur für die Implementation nötig ist oder aus der Bequemlichkeit der Notation folgt.[Gruber,1993]

Minimale ontologische Vereinbarung: Eine Ontologie sollte der minimalen ontologischen Vereinbarung genügen, damit der Wissensaustausch unterstützt werden kann. Sie sollte so wenig wie möglich Ansprüche und Forderungen an den zu modellierenden Realweltausschnitt haben, um anderen Gruppen die Möglichkeit zu geben, dieser Ontologie zustimmen zu können. Die Gruppen sollen die Freiheit haben, die Ontologie so zu spezialisieren und zu instanziieren, wie sie es brauchen. Die ontologische Zustimmung beruht auf der Benutzung eines konsistenten Vokabulars[Gruber,93]. Software-Agenten können einer Ontologie zustimmen, wenn ihre Aktionen konsistent mit den Definitionen in der Ontologie sind. Ontologische Übereinstimmung: Die ontologische Übereistimmung ist die Übereinkunft darüber, dass ein Konzept mit der Ontologie übereinstimmt. Um gemeinsam Ontologien benutzen zu können, wird eine Ontologische Übereinstimmung (ontological commitment) benötigt, um miteinander über ein Sachgebiet zu kommunizieren, ohne sich mit der global genutzten Theorie auseinander zu setzen. Ontologische Übereinstimmungen sind Vereinbarungen darüber, dass ein gemeinsam genutztes Vokabular in einer kohärenten und konsistenten Art und Weise benutzt wird.[Gruber,1993] Eine Übereinstimmung oder Zustimmung zu einer Ontologie ist eine Garantie für Konsistenz, aber sie garantiert nicht für die Vollständigkeit des Vokabulars, das von der Ontologie definiert wird.

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335616

Page 17: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Open World Prinzip: Das Open World Prinzip geht davon aus, dass das Wissen der Welt unvollständig ist. Wenn eine wahre Aussage nicht beweisbar ist, muss es nicht automatisch falsch sein. In RDF und OWL wird dieses Prinzip angewendet.Beispiel1:Aussage: „Mary“ „ ist ein BürgerIn von“ „Frankreich“Frage: Ist Mary eine BürgerIn von Kanada?Antwort Closed World: zb in XML oder SQL: „Nein“Antwort Open World: „unbekannt“ (Mary könnte mehrere Staatsbürgerschaften besitzen)

Beispiel2: Aussage: „Schwein“ „ ist ein“ „Tier“Frage: Können Schweine fliegen?Antwort Closed World: zb in XML oder SQL: „Nein“, weil die Aussage nichts darüber erzählt, dass Schweine fliegen können. Antwort Open World: „unbekannt“

(es sei denn, es gäbe eine weitere Aussage: „nicht (Schweine können fliegen)“

Im Gegensatz dazu basiert das Close World Prinzip auf der Annahme zur Weltabgeschlossenheit. Alles, was nicht explizit als wahr bewiesen werden kann, wird als falsch und ist daher nicht ableitbar. Dieses Prinzip eignet sich für die Validierung von Daten und wird von vielen regelbasierten Programmiersprachen verwendet [Rosati,05].

Reasoning: Reasoning ist das Schlussfolgern aus schon vorhandenen Informationen. ZB. Raben sind Vögel. Alle Vögel haben Flügel. Die Frage: Haben Raben Flügel? Die Schlussfolgerung kann aus den vorhergehenden beiden Sätzen vernünftig antworten. Man unterscheidet verschiedene Formen von Reasoning: Formales reasoning: beruht auf Grundregeln der Inferenz mit LogikProzedurales reasoning: benutzt Prozeduren, die spezifizieren, wie das Problem eventuell gelöst werden kann. Weitere Informationen siehe: [http://www.cs.cf.ac.uk/Dave/AI2/node76.html]

Reduktion auf die Logik:Jede Sprache ist Ausdruck einer Ontologie, d.h. einer speziellen Weltsicht, die in einer Klassifizierung und Verknüpfung der Gegenstände der Sprache manifestiert. So können Klassen von Worten der natürlichen Sprache semantische Kategorien wie Ding, Handlung, Vorgang, Eigenschaft, etc. zugeordnet werden und damit ein Abbildd der speziellen Weltsicht dargestellt werden. Weil die reale Weltsicht und die von der formalen Ontologie abgebildete Weltsicht keineswegs homomorph sind, da sie vielmehr strukturelle und semantischen Unterschiede aufweisen, müssen bei einem Modellierungsprozess die wesentlichen Umgruppierungen und Neu-Zuordnungen getroffen werden. Die Reduktion auf die Logik ist der Übergang von der natürlichen Weltsicht auf die formale Ontologie, die durch eine Transformationsarbeit geleistet werden muss [Braun,Hesse et al,1995].

Reduktion auf die Syntax: Sprachen drücken unterschiedliche Weltsichten aus [Braun,Hesse et al,1995]. Grundsätzliche Schwierigkeiten bestehen bei den unterschiedlichen Begriffsbildungen und –verwendungen: Objekt, Klasse und Typ, Attribut und Merkmal, Methode Dienst und Operation, Subjekt, Cluster und Komponente, sind nur Beispiele von Begriffen, die von unterschiedlichen Autoren unterschiedlich gebraucht werden, unscharf oder gar nicht gegeneinander abgegrenzt sind, synonym oder homonym verwendet werden und oft für vielfältige Interpretationen Raum lassen. Besonders störend sind diese Begriffsverwirrungen bei Vergleichen, die computerbasiert ablaufen sollen. Die Reduktion auf die Syntax ist der Versuch, bestehende Begriffe und Sprechweisen mit Hilfe einer rationalen Grammatik zu erfassen, mit Methoden der Sprachkritik zu analysieren und daraus konstruktive neue Begriffssyteme abzuleiten (zitiert in [Braun,Hesse et al,1995]), um so zu einer terminologischen Normierung zu kommen, die sowohl Eindeutig und maschinenlesbar ist, als auch von Menschen verstanden und genutzt wird.

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335617

Page 18: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Schwergewichtige Ontologie: Schwergewichtige Ontologien sind umfangreich axiomatisiert und repräsentieren explizit eine ontologische Übereinstimmung. Der Zweck einer Axiomatisierung ist, die terminologische und konzeptuelle Mehrdeutigkeiten zu eliminieren, die zu ungewollten Interpretationen führen können. [Oberle, 2005] Jede schwergewichtige O. kann auch eine leichtgewichtige Version haben. Viele große Ontologien sind schwergewichtig, weil sie viele komplexe Schlussfolgerungen unterstützen müssen, z.B. für die Integration von DB-Schemata oder komplexe zusammenhängende Anwendungen durchführen müssen. Ein sehr ausdrucksstarke Sprache wie KIF, OWL-DL und OWL-Full können auch die Entwicklung von in sich stimmigen Systemen verkomplizieren oder ihre Effizienz leidet. Z.B. ist es sehr unwirtschaftlich, wenn man die ganze Welt modellieren muss, wenn nur ein paar Schrauben klassifiziert werden sollen.

Software Agenten: SW-Agenten sind Programme, die Webinhalte von verschiedenen Ressourcen und Quellen sammelt, die Informationen verarbeitet und die Ergebnisse mit anderen Programm-Agenten austauscht[dHelicFensel,2001].

Synonym: Zwei Begriffe sind äquivalent, wenn sie semantisch auf das gleiche Konzept verweisen, aber durch unterschiedliche Namen repräsentiert werden. Dies kann zu einer Fehlanpassung bei der Konzeptualisierung führen (conceptual mismatch)[sekt(422SOA),2003].

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335618

Page 19: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Literaturverzeichnis

Bechhofer,2002 Sean Bechhofer: Ontology Language Standardisation Efforts; OntoWeb Deliverabel 4.0, Version 29.01.2002

Blazquez,1997? M.Blázquez, M.Fernández, J.M.Garcia-Pinar, A. Góez-Pérez: Building Ontologies at the Knowlege level using the Ontology Design Environment

BO97 Borst, W.N: Construction of Engineering Ontologies. PhD thesis, University of Tente, Enschede. 1997

Braun,Hesse et al,1995 H.v.Braun, MSP München; W. Hesse, Univ.Marburg; H.B. Kittlaus, SIZ Bonn; G.Scheschonk, C.I.T.Berlin: Ist die Welt objektorientiert? Von der natürlich-sprachlichen Weltsicht zum OO-Modell, GIAK Artikel 1995

Bry,2005 Francois Bry: "Reasoning ist der Motor des Semantic Web", veröffentlicht in www.semantic-web.at, 2005

Buccela,2005 Agustina Buccella, Alejandra Cechich and Nieves R.Brisaboa: Ontology-Based Data Integration Methods: A Framework for Comparison, 2005

Calvanese,1998 D.Calvanese, G. De Giacomo, M. Lenzerini: On the Decidability of Query Containment under Constraints; 1998

Calvanese,2001 Diego Calvanese, Giuseppe De Giacomo, Maurizio Lenzerini: A Framework for Ontology Integration. Università di Roma, 2001

Corcho,2005 Oscar Corcho, Asunción Gómez-Pérez: A Layered Model for Building Ontology Translation System; Spanien, 2005

Corcho,Pérez,2000 Oscar Corcho, Asuncion G´mez-Pérez : A Roadmap to Ontology Specification Languages, 2000

covischlie,2002 Ubbo Visser & Christioph Schlieder: Modelling Real Estate Transactions: the Potential Role of Ontologies. Ashgate, 2002

Cui,2000 Cui,Z. and O'Brien, P. : Domain Ontology Management Environment. In Proceedings of the 33rd Hawei International Conference on System Siences. 2000

DERRIDA,2004 From Metapattern to Ontoprise: The Devil is in the Detail(S.92)

dhelicFensel,2001 Denis Helic: Aspects of Semantic Data Modeling in Hypermedia Systems, Graz University of Technology July 2001, (S.54)

Do JeKrie",2004 Wolfgang Dostal, Mario Jeckle und Werner Kriechbaum: Semantik und Web Services: Beschreibung von Semantik

DoJeKrie,2004 Wolfgang Dostal, Mario Jeckle und Werner Kriechbaum: Semantik und Web Services: Vokabulare und Ontologien

Drummond,Shearer,2006 Nick Drummond,Rob Shearer : The Open World Assumption; The University of Manchester 2006

Eberhart, 2004 Andreas Eberhart: Ontology-based Infrastructure for Intelligent Applications, Saarbrücken, 2004

FaFiRi,1996 Adam Farquhar, Richard Fikes, James Rice: The Ontolingua Server: a Tool for Collaborative Ontology Construction, Stanford University

Fensel et al,2000 Jeen Broekstra, Michel Klein, Stefan Decker, Dieter Fensel, Ian Horrocks: Adding formal semantics to the Web 4.Septeber 2000

GG95 Guarino N. and Giaretto: Ontologies and Knowledge Bases: Towards a Terminologi-cal Clarifcation. Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing . 1995

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335619

Page 20: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Gil,Ratnakar,2000 Yolanda Gil and Varun Ratnakar: A Comparison of (Semantic) Markup Languages

Gómez-Pérez et al,1997 M.Fernández, G´mez-Pérez und N. Juristo: METHONTOLOGY: From Ontological Art towards Ontological engineering; 1997 AAAI Press zitiert in [Blazquez,1997?]

Gr93 Tom Gruber: A Translation Approach to Portable Ontology Specifications. Knowledge Acquisition, Vo. 5:5.199-220.1993

Gruber,1993 Tom Gruber: Toward Principles for the Design of Ontologies Used for Knowlege Sharing

Grüninger,2005 Michael Grüninger: Model-theoretic Approaches to Semantic Integration (Extended Abstract). Zitiert in: Dagstuhl Seminar 05371:"Principles and Practices of Semantic Web Reasoning", September 2005

Guarino,1998 Formal Ontology and Informationssystems.Helbig, Glöckner,2006 Towards a logical foundation of semantic networks: A

typology of descriptive means for semantic inference. In Inference in Computational Semantics ICoS-5, Workshop Proceedings (herausgegeben von Bos, Johan und Alexander Koller), S. 151-156. Buxton, UK.

ISO/TC International Organization for Standardization/Technical Commitees TC215: Health informatics; http://www.iso.org/iso/en/stdsdevelopment/tc/tclist/TechnicalCommitteeDetailPage.TechnicalCommitteeDetail?COMMID=4720

Jahresbericht,2006 Professor Studer: Wissensmanagement; M.Ehrig, P.Haase, J.Hartmann, D. Oberle, C. Tempich,R.Studer, Y.Sure: Ontology Management und Semantische Portale; im Jahresbericht Mai 2006 der Universität Karlsruhe; Jahrsbericht0506_Bry.pdf

Kalfoglou, Schorlemmer,2002 Yannis Kalfoglou und Marco Schorlemmer: Ontology mapping: the state of the art;

Katz's Web, 2003 Semantic Web, Lisp, music and general sintafulation: prividing content in a sea of bureacracy; June 2003

Koffina et al Ionanna Koffina, Giorgos Serfiotis, Vassilis Christophides, Val Tannen & Alin Deutsch: Integration XML DataSources using RDF/S; Zitiert in Dagstuhl Seminar 2005

Kurzweil,1990 Raimond Kurzweil: Das Zeitalter der Künstlichen Intelligenz; Artikel: "Die Suche nach dem Wissen"

Loenneker,2003 Birte Lönneker: Konzeptframes und Relationen: Extraktion, Annotation und Analyse französischer Corpora aus dem World Wide Web, Hamburg, 2003

LóPéSierra, 1999 Marinano Fernández López, Asunción Gómez-Pérez, Juan Pazos Sierra: Building a Chemical Ontology Using Methontology and the Ontology Desing Environment; Madrid 1999 - chemical_ontology.pdf

metamodel,2003 www.metamodel.com: What are the differences between a vocabulary, a taxonomy, a thesaurus, an ontology and a meta-model?

Noy,McGuinnes, 2001 Nataya F.Noy und Deborah L. McGuiness: Ontology develpment 101: A Guide to Creating Your First Ontology, Standford University

Ogden et al Charles K. Ogden, Ivor A. Richards, The Meaning of Meaning. London, 1923 zitiert aus OnlineArtikel XML & Web Services Maganzin Ausgabe:4.2003: Fahrt in die Havel, DAML+OIL - Über den praktischen Nutzen von Ontologien von Krzysztof Janowicz

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335620

Page 21: Ontologie-basierte gemeinsame Informationsnutzung · Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und Wissensmanagement Lehrgebiet: Multimedia und Internetanwendungen

Wintersemester 2006/07 Seminar 1910: Daten-, Informations-und WissensmanagementLehrgebiet: Multimedia und Internetanwendungen Univ.-Prof.Dr.-Ing. Matthias L.HemmjeFernUniversität in Hagen

Rosati,2005 Riccardo Raosati (Universitä di Roma I): Semantic and computational advantages of the safe integration of ontologies and rules. Zitiert in: Dagstuhl Seminar 05371:"Principles and Practices of Semantic Web Reasoning", September 2005

Seedorf,Tomcyk,2005 Stefan Seedorf und Peter Tomcyk: Ein angepasstes Vorgehensmodell zur Entwicklung von Domänenontologien in der semantikbasierten Sofwareentwicklung; Arbeitspapier 2/2005

sekt(422SOA),2003 SEKT:= semantically Enabled Knowledge Technologies: D4.2.2 State-of-the-art survey on Ontology Merging and Aligning V2

sekt(661),2003 Stephan Bloehdorn, Peter Haase, York Sure and Johanna Voelker (Universität Karlsruhe): Report on the integration of ML, HLT and OM

sekt712,2006 York Sure, Christoph Tempich und Denny Vrandecic: D7.1.2 SEKT Methodology: Initial Framework and Evaluation of Guidelines; 2006 AIFB, Karlsruhe

SOWA,2003 http://www.jfsowa.com/ontology/index.htm: Ontology, Definition and Scope, last modified:2003

Staab and Studer,2004 Staab, S. and Studer, R., editors 2004. Handbook on Ontologies in Information Systems.

StuckenschmidtVanHarmelen,2003 Heiner Stuckenschmidt und Frank van Harmelen: Information Sharing on the Semantic Web, 2003

Sure et al,2002 York Sure, Michael Erdmann, Juergen Angele, Steffen Staab, Rudi Studer, Dirk Wenke: Collaborative Ontology Develpment for the Semantic Web; Karlsruhe 2002

Sure et al,2006 York Sure, Marc Ehrig, Rudi Studer: Automatische Wissensintegration mit Ontologien; Institut AIFB Karlsruhe, 2006

Sure,2004 Dr.York Sure: Ontologien, Institut AIFB Karlsruhe; KompetenzNetzwerk Wissensmanagement 26.05.2004

Trabant,1996 Einführung in die Semiotik: Jürgen Trabant, Elemente der Semiotik, Tübingen, Basel, Francke Verlag, 1996*

Uschold,1996 Mike Uschold & Michael Gruninger: ONTOLOGIES:Principles, Methods and Applications, Feb. 1996

W3C,2004 http://www.w3.org/TR/2004/REC-owl-features-20040210/ : OWL Web Ontology Language Overview, 2004

Wache,2003 Benjamin Lee Whorf: "Sprache - Denken - Wirklichkeit" Beiträge zur Metalinguistik und Sprachphilosophie; Herausgegeben und übersetzt von Peter Krausser

Whorf,2003 Benjamin Lee Whorf: "Sprache - Denken - Wirklichkeit" Beiträge zur Metalinguistik und Sprachphilosophie; Herausgegeben und übersetzt von Peter Krausser

Christina Sergel, Gundackersdorf 12, 85229 Markt Indersdorf, Matr.Nr.: 567335621