Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet: Multimedia und Internetanwendungen (Univ.-Prof.Dr.-Ing. M.L. Hemmje) Thema: Daten-, Informations- und Wissensmanagement im Internet FernUniversität Hagen ws2006/07- Christina Sergel
35
Embed
Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Ontologie-basierte Informationsnutzung
2. Kapitel aus dem Buch
Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen
Lehrgebiet: Multimedia und Internetanwendungen
(Univ.-Prof.Dr.-Ing. M.L. Hemmje)
Thema: Daten-, Informations- und Wissensmanagement im Internet
FernUniversität Hagen ws2006/07- Christina Sergel
1.0 Inhalt
1. Semantische Heterogenität
2. Ontologien
3. Ontologien in der Informationsintegration
4. Framework für die ontologiebasierte Informationsnutzung
5. Ontologische Vereinbarungen
6. Ontologie-Engineering
1.0 Semantische Heterogenität
1. Semantische Heterogenität
2. Ontologien
3. Ontologien in der Informationsintegration
4. Framework für die ontologiebasierte Informationsnutzung
5. Ontologische Vereinbarungen
6. Ontologie-Engineering
1.1 Semantische Heterogenität
• Konflikte durch semantische Heterogenität:– Verwechslungskonflikte: Käfer = Auto oder Tier? – Skalierungskonflikte: 3-Sterne Hotel = traumhaftes
Hotel?– Namenskonflikte: Lehrer = Angestellter = Person
• Mangel für ein gemeinsames Verständnis: – nicht eindeutig, dadurch
Kommunikationsschwierigkeiten – Unterschiedliche Spezifizierungen für ein System
Ontologien als Lösung
2.0 Ontologien
1. Semantische Heterogenität
2. Ontologien
3. Ontologien in der Informationsintegration
4. Framework für die ontologiebasierte Informationsnutzung
5. Ontologische Vereinbarungen
6. Ontologie-Engineering
2. Ontologien
1. Der Begriff Ontologie
2. Was sind Ontologien
3. Konzeptualisierung
4. Gemeinsam genutztes Vokabular
5. Spezifikation des Wissenskontexts
6. Sinnvolle Anwendungen
Bild: Zoologische Staatssammlung München
2.1 Der Begriff Ontologie
• Disziplin der Philosophie – die Lehre vom Sein.
• Im Kontext der Informationstechnologie „An Ontology is a formal, explicit specification of a shared conceptualization“ [Gruber,1993]
• besteht aus 4 Komponenten: Konzepte, Instanzen Relationen, Axiome.Bild: DERRIDA‘S MACHINES 2004:Polycontextural modelling of polysemy
2.2 Was sind Ontologien
• Ontologie als ein kontrolliertes VokabularEine Menge von Begriffen mit sehr detaillierter und eindeutigen Beschreibung. Einigung auf gemeinsame Sprache
• Ontologie als Taxonomienhierarchisch strukturierte IST-EIN-Beziehung von Konzepten und Begriffen: Branchenbuch,ISO-Nr.
• Ontologie & Schemata–Schemata beschreiben die Definition von Bedingungen, zB Typen, Schemata werden entworfen für eine spez. Applikation
• Web-Ontologie sind Taxonomien mit InferenzregelnDas Ziel ist ein bestimmtes Fachgebiet mit einer großen Community zu konzeptualisieren.
Bild: Zoologische Staatssammlung München
2.3 Konzeptualisierung
• ein abstraktes Modell von Konzepten und seinen Beziehungen für ein allgemein anerkanntes Weltbild
• Ein Konzept ist eine gedankliche Vorstellung über ein reales Ding in der Welt.
• Eine explizite Spezifizierung gibt den Konzepten und Beziehungen des abstrakten Modells explizit Namen und Eigenschaften.
Semantisches Dreieck von Ogden et al.
2.4 Gemeinsam genutztes Vokabular
Eigenschaften von begrifflichen Ordnungssystemen [RWTH01]
Für ein gemeinsames Verständnis für Mensch und Maschine: • Erstellung eines standardisierten und „kontrollierten“ Vokabulars,
das von allen Beteiligten allgemein anerkannt und genutzt wird. • Vokabular muss einschränkend + spezifisch genug sein, • hinreichend flexibel + so allgemein wie möglich, • Disjunkt (Pizza<> Eis )und vollständig (Länder einer Welt)
Martin Pflüglmayer: Computerbasierte Terminologie:“Medizinische Ordnungssysteme, Terminologien und Ontologien“; Aachen 2001
2.4.1 Commen Sense Knowledge CyC
Die CyC-Wissens-Pyramide
• hunderttausende Begriffe
• Formt eine Upper-Ontologie
• Seit April 2006 unabhängige non-profit Organisation OpenCyC
– Konsistenz und Mehrdeutigkeiten: konsistente Ontologie durch Reasoners
– Integration von verschiedenen Ansichten: ffPoirot
ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996
2.6.2 Systemtechnik
• Spezifikation: von Anforderungen für ein IT-System (Dokumentation)
• Zuverlässigkeit: informale bzw. formale Konsistenzüberprüfung
• Wiederverwendbarkeit: easy to re-use-Bibliothek, Aufbau der Ontologie-Bibliotheken.
• Erweiterbarkeit, Offenheit: Ontologie-Bibliotheken müssen erweiterbar sein
2.6.3 Interoperabilität
• Ontologien als Austauschformat (KIF)
Gemeinsam genutztes Vokabular erleichtert InteroperabilitätQuelle:ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael
Gruninger ,1996
2.6.4 Information Retrieval
• für die qualitative Suche (informal und formal)
besseres Verständnis
• Für die Wissensgewinnung
• Ontologien für die Evaluation von Wissenssystemen
Content Management Systeme (OntoWeb)
ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996
Ontologien in der Informationintegration
1. Semantische Heterogenität
2. Ontologien
3. Ontologien in der Informationsintegration
4. Framework für die ontologiebasierte Informationsnutzung
5. Ontologische Vereinbarungen
6. Ontologie-Engineering
3.1 Welche Rollen haben Ontologien
• Repräsentation des InhaltsAufgabe der O. ist Wissensrepräsentation – Single-Ontologie-Ansatz
– Multiple-Ontologie-Ansatz
– Hybrid-Ansatz
• Query-ModellZugriff auf die Wissensbasis
• VerifikationWartung der Integration und Extension
3.1.1 Single-Ontologie-Ansatz: SIMS
• Eine zentrale Ontologie globale Sicht auf unterschiedl. Sourcen
• Gemeinsam genutztes Vokabular
• Vergleich d. O. einfach, • Enge Kopplung• Keine Wiederverwendung v. O.• Anfällig für Source-
Änderungen• Semantische Datenintegration?
Quelle: Tzi: methodolgies for Ontology-Based Semantic Translationsekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning
3.1.2 Multi-Ontologie-Ansatz:zB. OBSERVER
•Jede Informationsquelle hat seine eigene Ontologie (lokal View)•Kein gemeinsam genutztes Vokabular autonom•Lose Kopplung, keine ontologische Übereinstimmung•Vereinfacht Integration•Komplexität des O-Mapping O(n2) 1:1-Mapping beim OBSERVER, worst case: one way Mapping
Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning
.
3.1.3 Hybrid-Ansatz: z.B. COIN
• Jede Ressource hat seine eigene Ontologie
• Aufgebaut aus dem global gemeinsam genutzten Vokabular
• Neue Ressourcen können leicht hinzugefügt werden
• Unterstützt Evolution und Erwerb • Ontologien sind vergleichbar• Query-Prozessing ist komplex• Keine Wiederverwendung von O.
Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning
3.2.0 Query-Modell
Zentrale Aufgabe von Ontologien: • Inferenzen auf und Abfragen von Ontologien
– Abfrage auf Ontologiestruktur – Abfrage von Fakten,
Kriterien für ein Query-Modell:• Verständlichkeit: Abfrage mit O-Begriffen intuitiv? für
welche Aufgaben kann es genutzt werden? Antworten klar und einfach ?
• Query Plan: klare Beschreibungen für jeden Interaktionsschritt zwischen den Ontologien.
• Optimierung: kann die Abfrage dramatisch beschleunigen.
3.3.0 Verifikation
• Verifikation: nicht die Ontologie wird überprüft, sondern die Korrektheit nach Mappings von Globalen zu lokalen Ontologien und umgekehrt
• Validation einer Ontologie: in wieweit entspricht die Ontologie dem Realitätsausschnitt, den sie abbilden soll
• Nur möglich bei formalsprachlicher Spezifikation, die vollständig ist. (Query containment)
• Qualität der Überprüfung ist von der Vollständigkeit einer Ontologie abhängig.
4.0 Framework für die Informationsnutzung
1. Semantische Heterogenität
2. Ontologien
3. Ontologien in der Informationsintegration
4. Framework für die ontologiebasierte Informationsnutzung
5. Ontologische Vereinbarungen
6. Ontologie-Engineering
4.1 Framework für die ontologiebasierte Informationsnutzung
2 prinzipielle Methoden für gemeinsame Nutzung von Informationen: