Vorlesung Dr. Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam Wintersemester 2009/10 Semantic Web Blog zur Vorlesung: http://sewe0910.blogspot.com/ Die nichtkommerzielle Vervielfältigung, Verbreitung und Bearbeitung dieser Folien ist zulässig (Lizenzbestimmungen CC-BY-NC ).
89
Embed
27.10.2009, 02-URI und XML/XSD, Vorlesung Semantic Web
Jedes Ding muss einen Namen haben ... kurzer Abstecher in die Welt der URIs/URLs/URNs/IRIs
So banal es auch klingen mag, die eindeutige Benennung von Entitäten bildet die Grundlage des Semantic Webs. Und zwar nicht nur die Benennung von Informationsressourcen, die über das WWW zugreifbar sind. Nein, es betrifft alle möglichen (und unmöglichen) Objekte der realen und abstrakten Welt, über die irgendwelche Aussagen getroffen werden können, und die mit irgendwelchen anderen Objekten in Zusammenhang stehen. Dabei müssen wir unterscheiden zwischen dem (realen) Objekt und seiner (informalen) Repräsentation im WWW. Bezeichnet die URI des "Eiffelturms" wirklich den Eiffelturm selbst oder nur eine Informationsdatei über den Eiffelturm (also z.B. die zugehörige Wikipediaseite, o.ä...). Dahinter steckt ein bereits altes Problem der Philosophie und Sprachwissenschaft (genauer, der Semiotik), die zwischen "Bezeichnetem" und "Bezeichnendem" unterscheidet.
Eigentlich sollte jeder von Ihnen schon einmal etwas von XML und XML-Derivaten gehört haben. Der Vollständigkeit halber wiederholen wir morgen kurz XML- und XML-Schema-Grundlagen. Dies ist wichtig, da jeder weitere Dialekt zur Wissensrepräsentation im Semantic Web auf der Grundlage dieser Metasprache zur Definition von beliebigen Vokabularien beruht - zumindest in ihrer jeweiligen XML-Serialisierung. Später werden wir noch andere Repräsentationsformen für RDF/RDFS/OWL kennenlernen, z.B. N3, Turtle oder Description Logics. Die XML-Serialisierungen sind aber am weitesten verbreitet und - wenn auch schwieriger zu lesen - für den Rechner oft einfacher zu verarbeiten (dank bereits existierender Parser...).
Zudem werden wir sehen, dass XML und XML-Schema alleine noch nicht ausreichen, um tatsächlich auch Semantik formal repräsentieren zu können. Warum? ... das erfahren Sie natürlich in der Vorlesung :)
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Vorlesung
Dr. Harald Sack
Hasso-Plattner-Institut für Softwaresystemtechnik
Universität Potsdam
Wintersemester 2009/10
Semantic Web
Blog zur Vorlesung: http://sewe0910.blogspot.com/Die nichtkommerzielle Vervielfältigung, Verbreitung und Bearbeitung dieser Folien ist zulässig (Lizenzbestimmungen CC-BY-NC).
2. Semantic Web BasisarchitekturDie Sprachen des Semantic Web - Teil 1
2.1.Uniform Resource Identifier - URI
2.2.XML und XMLSchema
2.3.Resource Description Framework - RDF
2.4.RDF Schema
2.5.Wie kommt die Semantik ins WWW?
2.6.Abfragesprache SPARQL
2.7.Warum reicht RDF(S) noch nicht aus?
14
Semantic Web - Vorlesungsinhalt
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
5
2. Semantic Web Basisarchitektur2.1 Uniform Resource Identifier - URI
Uniform Resource Identifier - URI■ Ein Uniform Resource Identifier (URI) definiert ein einfaches und
erweiterbares Schema zur weltweit eindeutigen Identifikation von abstrakten oder physikalischen Ressourcen (RFC 3986).
■ Ressource kann jedes Objekt sein, das (im Kontext der jeweiligen Anwendung) eine klare Identität besitzt ,
□ also z.B. (z.B. Webseiten, Bücher, Orte, Personen, Beziehungen zwischen diesen Dingen, abstrakte Konzepte usw.)
■ Das URI Konzept ist in verschiedenen Anwendungsbereichen bereits etabliert,
□ wie z.B. Web (URL, PRN, pURL), Bücher (ISBN), Digital Object Identifier (DOI)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
6
2. Semantic Web Basisarchitektur2.1 Uniform Resource Identifier - URI
Uniform Resource Identifier - URI■ „Uniform“
□ Unterschiedliche Typen von Ressourcen-Identifikatoren aufgebaut nach einem einheitlichem Schema
■ „Resource“
□Was auch immer über einen URI identifiziert werden kann
■ „Identifier“
□ zur Unterscheidung einer Ressource von einer anderen
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
7 Uniform Resource Identifier - URI■ URI umfasst sowohl
□ Adressangaben (Locator)
□Uniform Resource Locator (URL, RFC 1738)□gibt an, wo eine Web-Ressource zu finden ist indemihr primärer Zugriffsmechanismus beschrieben wird□kann sich im Lebenszyklus der Web-Ressource ändern
□ Identitätsbezeichner (Namen)
□Uniform Resource Name (URN, RFC 2141)□persistenter Bezeichner für eine Web-Ressource□bleibt für die gesamte Lebensdauer konstant
2. Semantic Web Basisarchitektur2.1 Uniform Resource Identifier - URI
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
8 URI - Generische Syntax■ US-ASCII Encoding
■ Percent Encoding für reservierte Zeichen, oder Zeichen, die nicht im US-ASCII Encoding existieren pct-encoded = "%" HEXDIG HEXDIG
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
11 URIs im Semantic Web■Was tun, wenn eine URI für eine Ressource noch nicht existiert?
■ Selbstdefinierte URIs
□ Zur Vermeidung von Überschneidungen Nutzung der eigenen Website
□ Ermöglicht auch Ablage von zugehöriger Dokumentation an gleicher Stelle ( Content Negotiation)
■ Trennung von URI für Ressource (Beschriebenes) und deren Dokumentation (Beschreibendes) durch URI-Referenzen (durch "#" angehängte Fragmente) oder Content Negotiation
z.B.: http://hpi.ui-potsdam.de/harald_foaf.rdf#me
2. Semantic Web Basisarchitektur2.1 Uniform Resource Identifier - URI
2. Semantic Web BasisarchitekturDie Sprachen des Semantic Web - Teil 1
2.1.Uniform Resource Identifier - URI
2.2.XML und XMLSchema
2.3.Resource Description Framework - RDF
2.4.RDF Schema
2.5.Wie kommt die Semantik ins WWW?
2.6.Abfragesprache SPARQL
2.7.Warum reicht RDF(S) noch nicht aus?
14
Semantic Web - Vorlesungsinhalt
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
13
Warum HTML alleine noch nicht ausreicht■ HTML diente ursprünglich zur Beschreibung der Struktur eines Hypermedia-
Dokuments
■ Browser-Wars – Browser-Hersteller (Netscape/MS) definierten eigenständig proprietäre Erweiterungen der HTML-Syntax zur Formatierung von Strukturelementen
□ z.B. Tabellen mit absoluten Maßangaben
□ z.B. Schrifttyp, Schriftauszeichnungen, Schriftgröße, Farbe, etc…
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
13
Warum HTML alleine noch nicht ausreicht■ HTML diente ursprünglich zur Beschreibung der Struktur eines Hypermedia-
Dokuments
■ Browser-Wars – Browser-Hersteller (Netscape/MS) definierten eigenständig proprietäre Erweiterungen der HTML-Syntax zur Formatierung von Strukturelementen
□ z.B. Tabellen mit absoluten Maßangaben
□ z.B. Schrifttyp, Schriftauszeichnungen, Schriftgröße, Farbe, etc…
■ Problem: Formatierung vs. Semantik
<td width="261"><font color="#00ff00" face="Arial, Helvetica, sans-serif" size==“+1“> fetter Text
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
14
Semantik und HTML■Meta-Tags können zusätzliche Semantik in das HTML-Dokument
einbringen
■ Problem:
□ Erweiterungen nicht standardisiert
□ leicht manipulierbar Missbrauch
<meta name="description" content="Homepage of Dr. Harald Sack, … “><meta name="keywords" content="homepage teaching … “><meta name="Autor" content="Harald Sack">
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
15
Semantik und HTML■ Semantik der Meta-Tags beruht ausschließlich auf der privaten
Vereinbarung zwischen Informationsanbieter und Informationskonsumenten
■ Problem:
□ Syntax und Semantik gilt nur für spezielle Vereinbarung
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
26
XML – Deklaration■ XML-Referenzen:
□ Angabe des verwendeten XML-DTDs
□ Referenz auf externe Teilmenge (globale URI)
□ Referenz auf interne Teilmenge
<!DOCTYPE name SYSTEM/PUBLIC “URI“>
<!DOCTYPE name [DTD-Definitionen]>
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
XML – Element■ Beschreibung eines Objekts, das durch passende Markierungen (tags) wie
<vorname> und </vorname> geklammert ist
■ Inhalt eines Elements: Text und/oder weitere Elemente (Unterelemente)
■ Elemente können beliebig geschachtelt sein
■ Leere Elemente: <plz></plz> kurz: <plz/>
<adresse> <vorname> Max </vorname> <nachname> Mustermann </nachname> <straße> Sesamstr. </straße> <hausnummer> 49a </hausnummer> Max Mustermann ist ein fleissiger Student…</adresse>
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
XML – Element■ Beschreibung eines Objekts, das durch passende Markierungen (tags) wie
<vorname> und </vorname> geklammert ist
■ Inhalt eines Elements: Text und/oder weitere Elemente (Unterelemente)
■ Elemente können beliebig geschachtelt sein
■ Leere Elemente: <plz></plz> kurz: <plz/>
<adresse> <vorname> Max </vorname> <nachname> Mustermann </nachname> <straße> Sesamstr. </straße> <hausnummer> 49a </hausnummer> Max Mustermann ist ein fleissiger Student…</adresse>
Elementadresse
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
XML – Element■ Beschreibung eines Objekts, das durch passende Markierungen (tags) wie
<vorname> und </vorname> geklammert ist
■ Inhalt eines Elements: Text und/oder weitere Elemente (Unterelemente)
■ Elemente können beliebig geschachtelt sein
■ Leere Elemente: <plz></plz> kurz: <plz/>
<adresse> <vorname> Max </vorname> <nachname> Mustermann </nachname> <straße> Sesamstr. </straße> <hausnummer> 49a </hausnummer> Max Mustermann ist ein fleissiger Student…</adresse>
Elementadresse
Start-Tag
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
XML – Element■ Beschreibung eines Objekts, das durch passende Markierungen (tags) wie
<vorname> und </vorname> geklammert ist
■ Inhalt eines Elements: Text und/oder weitere Elemente (Unterelemente)
■ Elemente können beliebig geschachtelt sein
■ Leere Elemente: <plz></plz> kurz: <plz/>
<adresse> <vorname> Max </vorname> <nachname> Mustermann </nachname> <straße> Sesamstr. </straße> <hausnummer> 49a </hausnummer> Max Mustermann ist ein fleissiger Student…</adresse>
Elementadresse
Start-Tag
End-Tag
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
XML – Element■ Beschreibung eines Objekts, das durch passende Markierungen (tags) wie
<vorname> und </vorname> geklammert ist
■ Inhalt eines Elements: Text und/oder weitere Elemente (Unterelemente)
■ Elemente können beliebig geschachtelt sein
■ Leere Elemente: <plz></plz> kurz: <plz/>
<adresse> <vorname> Max </vorname> <nachname> Mustermann </nachname> <straße> Sesamstr. </straße> <hausnummer> 49a </hausnummer> Max Mustermann ist ein fleissiger Student…</adresse>
Elementadresse
Start-Tag
End-Tag
Unterelemente
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
XML – Element■ Beschreibung eines Objekts, das durch passende Markierungen (tags) wie
<vorname> und </vorname> geklammert ist
■ Inhalt eines Elements: Text und/oder weitere Elemente (Unterelemente)
■ Elemente können beliebig geschachtelt sein
■ Leere Elemente: <plz></plz> kurz: <plz/>
<adresse> <vorname> Max </vorname> <nachname> Mustermann </nachname> <straße> Sesamstr. </straße> <hausnummer> 49a </hausnummer> Max Mustermann ist ein fleissiger Student…</adresse>
Elementadresse
Start-Tag
End-TagFreitext
Unterelemente
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
28
XML – Attribute■ Name-Zeichenkettenwert-Paar
■ Assoziiert mit einem Element
■ Alternative Möglichkeit, Daten zu beschreiben
<adresse> <vorname> Max </vorname> <nachname> Mustermann </nachname> <ort plz=“01234“> Bad Sulzdetfurth </ort>…
Attribut plz
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
29
Wohlgeformtes und gültiges XML
Max MustermannSesamstr. 49a93123 Bad Sulzdetfurth
Wohlgeformte XML-Dokumente: Syntaktisch korrekt, d.h. alle angefangenen Tags werden wieder geschlossen und sind stets korrekt geschachtelt, keine Mehrfachattribute, nur ein Wurzelelement
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
51
Warum XML alleine noch nicht ausreicht…
CV
name
education
work
private
< >
< >
< >
< >
< >
Dokument
XML-Dokument mit„sprechenden“ Bezeichnern
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
52
Warum XML alleine noch nicht ausreicht…
Χς
ναµε
εδυχατιον
ωορκ
πριϖατε
< >
< >
< >
< >
< >
Dokument
XML-Dokument mit„sprechenden“ Bezeichnernaus der Sicht des einesProgramms
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
53
Warum XML noch nicht ausreicht…
Χς
ναµε
εδυχατιον
ωορκ
πριϖατε
< >
< >
< >
< >
< >
Dokument 1
Χς
ναµε
εδυχατιον
ωορκ
πριϖατε
< >
< >
< >
< >
< >
Dokument 2
<Χϖ>
<ναµε>…
Schema-Definition
Kommunikationspartner müssen sichüber die Semantik der Metadateneinigen
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
54
Warum XML alleine noch nicht ausreicht…
Χς
εδυχατιον
ωορκ
πριϖατε
< >
< >
< >
Dokument 1
< >
< >
Dokument 2
<Χϖ>
<ναµε>…
SchemaDefinitionen
<>
<>
…
SchemaDefinitionen
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
54
Warum XML alleine noch nicht ausreicht…
Χς
εδυχατιον
ωορκ
πριϖατε
< >
< >
< >
Dokument 1
< >
< >
Dokument 2
<Χϖ>
<ναµε>…
SchemaDefinitionen
<>
<>
…
SchemaDefinitionen
ναµε
< >
< >
< >
< >
< >
Ontologien BeschreibungslogikenRDF / OWL / SWRL
InferenzmechanismenTrust
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
55Warum XML noch nicht ausreicht…
■ Semantik eines XML-Dokuments erschließt sich nur dem menschlichen Benutzer
■ XML = syntaktisch standardisierte Meta-Sprache zur Kommunikation zwischen Systemen und zur Auszeichnung von Daten
■ XML dient der Beschreibung von Daten/Nachrichten im Semantic Web
■ Aber:
□ XML besitzt keine semantische Interoperabilität
□ Es ist stets ein Modell der Umgebung notwendig, d.h. Zusammenarbeit ist dann nur möglich, wenn sich die beteiligten Akteure über die Semantik der verwendeten XML-Syntax geeinigt haben
□ z.B. Agenten in abgeschlossenen homogenen Umgebungen ( WWW ist aber heterogen und dynamisch!)
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
Semantic Web Architektur56
URI / IRI
XML / XSDData Interchange: RDF
RDFS
Ontology: OWL Rule: RIF
Query:SPARQL
Proof
Unifying Logic
Cry
pto
Trust
Interface & Application
2. Semantic Web Basisarchitektur2.2 XML und XMLSchema
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam