DATA SUPPORT OPEN Trainingsmodul 2.4 RDF- Vokabulare entwerfen und entwickeln Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.com PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.
30
Embed
Trainingsmodul 2.4 RDF-Vokabulare entwerfen und entwickeln Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
DATASUPPORT
OPEN
Trainingsmodul 2.4
RDF-Vokabulare entwerfen und entwickeln
Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.comPwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.
Autoren: Nikolaos Loutas, Michiel De Keyzer, and Stijn Goedertier
Metadaten der Präsentation
Folie 2
Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE-0530965/00-17) finanziert.
1.Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden.Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission.Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind.
2.Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.
Am Ende dieses Trainingsmoduls sollten Sie wissen:
• was die Best-Practices bei der Erstellung eines RDF Vokabulars sind, mit dem Sie Ihre Daten modellieren können.
•wo Sie RDF Vokabulare zur Wiederverwendung finden können.
•wie Sie Ihr eigenes RDF-Vokabular erstellen können.
•wie Sie Ihre RDF-Vokabulare veröffentlichen können.
• wie der Prozess und die Methodik zur Entwicklung semantischer Vereinbarungen funktionieren, die vom ISA-Programm der Europäischen Kommission entwickelt wurden.
„Ein Vokabular ist ein Datenmodell, das Klassen, Eigenschaften und Beziehungen beinhaltet, die dazu genutzt werden können Ihre Daten und Metadaten zu beschreiben.”
RDF Vokabulare sind Sammlungen von Begriffen, die dazu genutzt werden können Dinge zu beschreiben.
Ein Begriff ist entweder eine Klasse oder eine Eigenschaft.
Klasse. Ein Konstrukt, das Dinge in der realen und/oder virtuellen Welt darstellt, z.B. eine Person, eine Organisation oder ein Konzept wie “Gesundheit” oder “Freiheit”.
Beziehung. Eine Verbindung zwischen zwei Klassen: zwischen einem Dokument und der Organisation, die es veröffentlicht hat (d.h. Organisation veröffentlicht Dokument); oder zwischen einer Karte und der geografischen Region, die sie zeigt (d.h. Karte zeigt geografische Region). In RDF werden Beziehungen als Objekttyp Eigenschaften kodiert.
Eigenschaft. Eine Eigenschaft einer Klasse in einer bestimmten Dimension, wie z.B. der offizielle Name einer Organisation oder das Datum und die Zeit, wann ein Beobachtung gemacht wurde.
Modellieren Sie Ihre DatenWie Sie andere Vokabulare wiederverwenden, Ihre eigenen Begriffe definieren und Ihre Vokabulare veröffentlichen und bewerben können, um damit Daten zu beschreiben.
• Unterschiedliche Domains haben unterschiedliche Anforderungen an die domainspezifische Semantik, z.B. Klassifikationskonzepte.
• Generische RDF-Vokabulare liefern normalerweise die Basisklassen, die benötigt werden, um Erweiterungen zu erlauben, mit denen, sofern erforderlich, spezifische Unterklassenstrukturen oder Klassifikations-schemen hinzugefügt werden können.
• In solchen Fällen werden Wiederverwender dazu ermutigt, Anwendungsprofile einer speziellen Anwendungsdomain zu definieren, indem sie (sofern erforderlich) Unterklassen, Untereigenschaften und kontrollierte Vokabulare spezifizieren.
• Zum Beispiel:
DCAT Anwendungsprofil für Datenportale in Europa
Registered Organization Vokabular als Anwendungsprofil der Organisations-Ontologie.
• Weiterverwendung fördert die Interoperabilität Ihrer Daten in hohem Maße.Beispielsweise bewirkt die Verwendung von <dcterms:created>, dessen Wert ein Datumsformat vom Typ 2013-02-21^^xsd:date sein sollte, dass die Daten sofort von vielen Maschinen verarbeitbar sind. Wenn Ihr Schema Datenherausgeber dazu zwingt ein abweichendes Format für Bezeichnungen und das Datum, wie ex:date "21 February 2013“ zu benutzen, dann ist für veröffentlichte Daten, bei denen Ihr Schema genutzt wird, eine weitere Verarbeitung erforderlich um sie anderen Daten anzugleichen.
• Weiterverwendung erhöht die Glaubwürdigkeit Ihres Schemas.Es zeigt, dass es mit genügend Sorgfalt und Professionalität veröffentlicht worden ist, was die Weiterverwendung weiter fördert.
• Weiterverwendung ist einfacher und billiger.Durch die Weiterverwendung von Klassen und Eigenschaften gut definierter und richtig gehosteter Vokabeln vermeiden Sie, dass Sie die Bemühung ihrer Erstellung wiederholen müssen.
• RDF-Schemata und Vokabulare enthalten oft Begriffe, die sehr generisch sind.
• Durch die Erstellung von Unterklassen- und Untereigenschafts-beziehungen können Systeme, die die übergeordnete Eigenschaft oder Klasse verstehen, in der Lage sein, die Daten zu interpretieren; selbst wenn die spezifischeren Begriffe unbekannt sind.
• Vermeiden Sie es, Unterklassen und Untereigenschaften aus dem einzigen Grund zu erstellen, damit Sie Ihren eigenen Begriff verwenden können, um etwas zu beschreiben, was bereits existiert.
Das Registered Organization Vokabular definiert drei Untereigenschaften von „org:classification“: ‚companyType‘, ‚companyStatus‘ und ‚companyActivity‘.
This property records the type of company. Familiar types are SA, PLC, LLC, GmbH etc. Each jurisdiction will have a limited set of recognised company types and these should be used in a consistent manner using a skos:Concept as described in the <a href="#skos:Concept">Code</a> Class.
Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen Umgebung, die erstellt wurde um persistent zu sein
•Wählen Sie einen stabilen Namensraum für Ihr RDF-Schema (z.B. W3C, Purl...)
• Folgen Sie Good Practices bei der Veröffentlichung von persistenten Uniform Resource Identifier (URI) Sets, sowohl in Bezug auf das Format als auch auf Entwurfsregeln und Verwaltung.
Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services registrieren
Sobald Ihr RDF-Schema veröffentlicht wurde, werden Sie wollen, dass die Leute es kennenlernen. Um ein breiteres Publikum zu erreichen, registrieren Sie es auf Joinup und Linked Open Vocabularies.
Folie 23
6
Refine the search results via the faceted search filters.
• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Folie 10-23:
• ISA Programme. Cookbook for translating Data Models to RDF Schemas. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Folie 16, 18-21:
•W3C. An organization ontology. http://www.w3.org/TR/vocab-org/
Folie 23:
• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure
EC, ISA Process and methodology for developing semantic agreements, https://joinup.ec.europa.eu/community/core_vocabularies/document/process-and-methodology-developing-semantic-agreements
EC ISA, Cookbook for translating Data Models to RDF Schemas https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas