Top Banner
DATA SUPPORT OPEN Trainingsmodul 2.1 Der Lebenszyklus von Linked Open Government Data & Metadata Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.com PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.
61

Der Lebenszyklus von Linked Offenen Regierungsdaten

Dec 28, 2014

Download

Technology

 
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORT

OPEN

Trainingsmodul 2.1

Der Lebenszyklus von Linked Open Government Data & Metadata

Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000

Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für

weitere Informationen unsere Webseite www.pwc.com

PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite

www.pwc.com/structure für weitere Details.

Page 2: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Diese Präsentation wurde von PwC erstellt Autoren: Michiel De Keyzer, Nikolaos Loutas and Stijn Goedertier Metadaten der

Präsentation

Folie 2

Disclaimer

1. Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden. Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission. Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind.

2. Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.

Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE-0530965/00-17) finanziert. © 2014 European Commission

Page 3: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Lernziele

Am Ende dieses Trainingsmodul sollten Sie

• einen Überblick darüber haben, was der Lebenszyklus von Linked Open Government Data (LOGD) ist;

• den Unterschied zwischen Angebot und Nachfrage für Daten kennen;

• die verschiedenen Schritte eines LOGD Lebenszyklus kennen;

• die Tools und Best Practices für jeden Schritt des Lebenszyklus kennen.

Folie 3

Page 4: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Inhalt

Dieses Modul enthält ...

• einen Überblick über die existierenden Lebenszyklen für Linked Open Government Data (LOGD).

• einen hybriden Lebenszyklus für LOGD und Metadaten, der sowohl die Angebots- als auch die Nachfrageseite bedient.

• einen Überblick über vorhandene Technologien für LOGD und Metadaten, einschließlich der Open Data Interoperability Platform (ODIP).

Folie 4

Page 5: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Verschiedene LOGD-Lebenszyklen Der aktuelle Stand der Dinge

Folie 5

Hyland et al.

Hausenblas et al.

Villazon-Terrazas et al.

Datalift Vision

LOD2 Linked Open Data Lifecycle

Siehe auch: http://www.w3.org/2011/gld/wiki/GLD_Life_cycle

Page 6: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Unterschiedliche LOGD-Lebenszyklen Beobachtungen

• Es gibt keinen standardisierten LOGD-Lebenszyklus.

• Die meisten Ansätze sind sich bezüglich eines Kernsets an Phasen einig, z.B. die Identifizierung des Modells/seine Veröffentlichung.

• Die derzeitigen Lebenszyklen konzentrieren sich hauptsächlich auf die Bereitstellung von Open Data:

Identifizierung und Auswahl von LOGD.

Modellierung und Bereinigung von LOGD.

Veröffentlichung und Verknüpfung von Daten.

• Aber was ist mit der Nachfrageseite?

LOGD finden und abrufen.

Open Data integrieren und weiterverwenden.

Rückmeldungen zu LOGD geben.

Folie 6

Page 7: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Was sind Metadaten?

“Metadaten sind strukturierte Informationen, die beschreiben, erklären, lokalisieren, oder es anderweitig einfacher machen, eine Informationsquelle abzurufen, zu verwenden oder zu verwalten. Daten zu bestimmten Daten oder Informationen zu bestimmten Informationen werden oft Metadaten genannt.”

-- National Information Standards Organization

http://www.niso.org/publications/press/UnderstandingMetadata.pdf

Folie 7

Datensatz Beschreibung (DCAT) Datensatz

Page 8: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Best Practices für die Veröffentlichung Ihrer Daten & Metadaten

1. Entwickeln Sie die Daten;

2. Benennen Sie Dinge mit URIs;

3. Verwenden Sie vorhandene Vokabulare wieder, wann immer möglich;

4. Veröffentlichen Sie von Mensch und Maschine lesbare Beschreibungen – Metadaten;

5. Konvertieren Sie die Daten in RDF;

6. Geben Sie eine passende Lizenz an;

7. Hosten Sie den verknüpften Datensatz und seine Metadaten öffentlich und geben Sie dies auch bekannt!

Das W3C Linked Data Kochbuch

Folie 8

Siehe auch: http://www.w3.org/TR/gov-data/) http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

Page 9: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

LOGD- und Metadatenlebenszyklus Fokussierung auf Angebot und Nachfrage

Folie 9

Select Model Publish Find Integrate Re-use

Data management

Feedback

Data Publisher

Data Consumers

Angebot Nachfrage

Page 10: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

LOGD & Metadaten Angebot Verwaltungen, die ihre Daten öffentlich machen und sie als Linked Data zusammen mit den entsprechenden Metadatenbeschreibungen veröffentlichen

Folie 10

Page 11: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl hochwertiger Daten

Mehrere Dimensionen können im Auswahlprozess von LOGD berücksichtigt werden, sowohl aus der Sicht des Herausgebers als auch des Wiederverwenders.

• Transparenz: Erhöht die Veröffentlichung des Datensatzes die Transparenz und die Offenheit der Verwaltung gegenüber ihren Bürgern?

• Gesetzliche Anforderungen: Gibt es ein Gesetz, das die Veröffentlichung verpflichtend macht oder gibt es keine solche Auflage?

• Verbindung mit öffentlicher Aufgabe: Sind die Daten das direkte Ergebnis einer Kernaufgabe der Verwaltung oder sind sie ein Produkt einer nicht wesentlichen Aktivität?

• Aktueller Stand der Veröffentlichung: Sind die Daten bereits öffentlich verfügbar oder müssen sie noch veröffentlicht werden?

• Art des Mehrwerts: Sind die Daten für soziale Zwecke nützlich oder haben sie kommerziellen Wert?

• Zielgruppe: Sind die Daten in erster Linie für die Öffentlichkeit oder für eine Back-Office-Integration bestimmt?

Folie 11

Page 12: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aus Transparenzgründen

In einigen Fällen kann die Veröffentlichung eines Datensatzes die Transparenz und Offenheit der Verwaltung gegenüber ihren Bürgern erhöhen, z.B.:

• Parlamentsdaten, wie beispielsweise Wahlergebnisse.

• Öffentliche Haushaltspläne.

• Personalkosten der öffentlichen Verwaltungen.

Alle oben genannten Beispiele tragen zur Transparenz der Arbeit öffentlicher Verwaltungen bei.

Folie 12

Page 13: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aufgrund gesetzlicher Anforderungen

Einige Daten können einem Gesetz oder einer Verordnung unterliegen, das/die ihre Veröffentlichung anordnet, z.B.:

• Gesetzestexte, Richtlinien, Verordnungen usw.

• Vorschläge und Verhandlungen von Parlament und Komitees.

• Wahlergebnisse.

• Öffentliche Budgets und Ausgaben.

• Ausschreibungen zu Angeboten und Auftragsvergaben.

Andere Daten können ein Nebenprodukt der Verwaltungsaktivität sein und es könnte für Bürger und Unternehmen nützlich sein Zugang dazu zu haben, z.B.:

• Zustand der Infrastruktur und öffentlicher Flächen (Straßen, Bäume).

• Fahrpläne der öffentlichen Verkehrsmittel und Abholzeiten der Müllabfuhr.

Folie 13

Page 14: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aufgrund eines Bezugs zur öffentlichen Aufgabe

Einige Daten können das direkte Ergebnis der primären öffentlichen Verwaltungsaufgabe sein, beispielsweise die Funktionen, die in COFOG aufgeführt sind, z.B.:

• Exekutive, gesetzgebende Organe, Finanz-/Steuerangelegenheiten usw.

• Öffentliche Ordnung und Sicherheit.

• Umweltschutz.

• Gesundheit.

• Kultur.

• Bildung.

Andere von der Verwaltung produzierte Daten sind unwesentlich (sie können vom privaten Sektor geliefert werden; und werden dies auch manchmal), z.B.:

• Kartierung zu Navigationszwecken (siehe Google Street View)

• Wettervorhersage (z.B. Internetseiten zum Wetter)

Folie 14

Page 15: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aufgrund öffentlicher Verfügbarkeit

Einige Daten sind bereits offen und elektronisch verfügbar, z.B. (in einigen Ländern):

• Katasterinformationen.

• Topographische Karten.

• Verkehrsinformationen.

• Wettervorhersagen.

Andere Daten können weiterhin der Öffentlichkeit vorenthalten werden (vielleicht weil es sehr schwer ist, sie zu veröffentlichen, weil sie persönliche oder vertrauliche Daten beinhalten oder weil sie teilweise der Lizenzierung durch Dritte unterliegen).

Folie 15

Page 16: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aufgrund der Art des Mehrwerts

Einige Daten können in erster Linie gesellschaftlichen Wert haben, z.B.:

• Gesetze und parlamentarische Daten (z.B. Abstimmungsverhalten der Volksvertreter)

• Informationen vor Wahlen (z.B. Programme der politischen Parteien)

• E-Demokratie und E-Partizipation (z.B. öffentliche Anhörungen)

Andere Daten können eher kommerziellen Wert (Geschäftsmodelle) haben, z.B.:

• Straßenkarten, Echtzeitverkehrsinformationen

• Echtzeitwetterdaten

• Wirtschaftsinformationen

Folie 16

Page 17: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aufgrund der Zielgruppe der Daten

Einige Daten sind für die Gesellschaft (Bürger und Unternehmen) bestimmt, z.B.:

• rechtliche Informationen.

• E-Demokratie, E-Partizipation und öffentliche Anhörungen.

• Beschaffung.

Andere Daten besitzen einen Wert für die interne Nutzung oder die Integration in das Backoffice, z.B.:

• Verschiedene Quellen, die zur Strafverfolgung genutzt werden.

• Indikatoren der Serviceleistungskennzahlen.

• Stellenbeschreibungen von Beamten.

Folie 17

Page 18: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aufgrund der Größe der Zielgruppe

Einige Daten sind auf große Zielgruppen und Massenmärkte ausgerichtet, z.B.:

• Verkehrsinformationen.

• Öffentliche Verkehrsmittel.

• Wahldaten.

Andere Daten sind für kleine Gruppen und Nischenmärkte von Bedeutung, z.B.:

• Informationen über Einrichtungen und finanzielle Unterstützung für Menschen mit Behinderung.

• Wirtschaftsstatistiken.

• Gerichtsentscheidungen.

Folie 18

Page 19: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Hoher Mehrwert aus der Perspektive eines Wiederverwenders

Aus der Sicht eines Wiederverwenders, hängt der Mehrwert eines Datensatzes vor allem von seinem Verwendungs- und Wiederverwendungspotenzial ab, das effektiv zur Erschließung von (neuen) Geschäftsmodellen führen kann.

Das Verwendungs- und Wiederverwendungspotenzial eines Datensatzes wird bestimmt durch:

• Die Größe und die Dynamik der Zielgruppe des Datensatzes; sowie

• Die Anzahl der neuen und bestehenden Systeme und Dienstleistungen, die den Datensatz benutzen.

Die Öffnung von Datensätzen mit einem hohen Verwendungs- und Wiederverwendungspotenzial führt zur Schaffung neuer Produkte und/oder Dienstleistungen, die un- oder mittelbare wirtschaftliche oder soziale Auswirkungen und/oder positive wirtschaftliche Externalitäten haben.

Folie 19

Page 20: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Auswahl aufgrund der Bedürfnisse der Zielgruppe Was für Daten brauchen/wollen die Wiederverwender?

Laut einer spanischen Studie werden die folgenden Arten von Informationen von Unternehmen am meisten wiederverwendet:

Folie 20

51,1% 46,8%

29,7% 27,7%

12,8% 12,8% 12,8% 10,0%

Siehe auch: http://datos.gob.es/datos/sites/default/files/files/Estudio_infomediario/121001%20RED%20007%20Final%20Report_2012%20Edition_vF_en.pdf

Page 21: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Domains für Datensätze in europäischen Datenportalen

Folie 21

Source:[http://data.gov.uk/data]

Source:[http://publicdata.eu/]

Source:[http://open-data.europa.eu/en/data/dataset] Metadaten

Page 22: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN Folie 22

Welche Datensätze werden auf Data.gov.uk am meisten angesehen?

http://data.gov.uk/data/site-usage/publisher?month= http://data.gov.uk/data/site-usage/dataset

nach Herausgebern nach Datensätzen

Page 23: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Bei der Modellierung Ihrer Daten und Metadaten geht es darum...

• Ihre Daten in einer strukturierten, verständlichen und maschinenlesbaren Weise verfügbar zu machen.

• Wiederzuverwenden, was in Bezug auf Vokabulare und Referenzdaten bereits existiert.

• Durch die Bereinigung Ihrer Daten ein angemessenes Qualitätslevel zu erreichen.

• Lizenzinformationen bereitzustellen, damit die Konsumenten Ihrer Daten wissen, was die Bedingungen zur Weiterverwendung sind.

• Eine umfangreiche Beschreibung (Metadaten) zu liefern.

• Semantische Technologien (RDF, HTTP URIs...) für die Beschreibung Ihrer Daten zu verwenden.

Folie 23

Page 24: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Modellieren Sie Ihre Daten - wiederverwenden, wenn möglich; prägen, wenn nötig

• Verwenden Sie vorhandene Vokabulare so oft wie möglich wieder.

Wenn Sie sehen, dass es für eine spezielle Domain keine wiederverwendbare, verbindliche Quelle gibt, erstellen Sie Ihre eigene mit Hilfe von:

◦ RDF Schemata (RDFS): Basis RDF Vokabular um die Klassen und die Eigenschaften von Klassen zu beschreiben.

◦ Web Ontology Language (OWL): Sprache zur Darstellung von Wissen um Ontologien zu beschreiben.

Folie 24

Siehe auch: http://www.slideshare.net/OpenDataSupport/model-your-data-metadata

http//www.w3.org/TR/owl-features/

http://www.w3.org/TR/rdf-schema/

Page 25: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Verwenden Sie allgemeine Vokabulare wieder, um Ihre Daten zu modellieren und zu beschreiben... (in RDF)

Universelle Vokabulare: DCMI, RDFS

Um Dinge zu benennen: rdfs:label, foaf:name, skos:prefLabel

Um Personen zu beschreiben: FOAF, vCard, Core Person Vocabulary

Um registrierte Organisationen zu beschreiben: Registered Organisation Vocabulary

Um Adressen zu beschreiben: vCard, Core Location Vocabulary

Um öffentliche Dienste zu beschreiben: Core Public Service Vocabulary

...und Metadaten...

Um Datensätze zu beschreiben (Metadaten): DCAT, DCAT Application Profile, VoID

Um Projekte zu beschreiben: DOAP, ADMS.SW

Um Interoperabilitätsassets zu beschreiben: ADMS

Folie 25

Page 26: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Finden von wiederverwendbaren Vokabularen Joinup

• Online-Plattform für die Suche nach und den Austausch von Interoperabilitätsassets mit ADMS.

Entwickelt von dem ISA-Programm der EK.

Folie 26 http://joinup.ec.europa.eu/

Verbessern Sie die Suchresultate, indem Sie die Suche durch unterschiedliche Filter eingrenzen.

2

Geben Sie einen Suchbegriff ein um Interoperabilitätsassets zu finden, die auf verschiedenen Websites verfügbar sind.

1

Die Suchresultate beinhalten eine relevante Beschreibung der Assets sowie den Link, wo sie diese downloaden können.

3

Page 27: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Finden von wiederverwendbaren Vokabularen Linked Open Vocabularies

Folie 27

http://lov.okfn.org/

• Bietet Ihnen einen einfachen Zugang zum Ökosystem der Vokabulare.

• Macht die Art und Weise deutlich, wie Vokabulare miteinander verknüpft sind.

• Liefert Metriken dazu, wie Vokabulare in der LOGD-Cloud genutzt werden.

• Entwickelt von der Open Knowledge Foundation.

Page 28: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Damit stellen Sie sicher, dass Daten und Metadaten auf einem angemessenen Qualitätsniveau und mit möglichst wenig Fehlern veröffentlicht werden können.

Das bedeutet:

• Fehler festzustellen.

• Formate zu transformieren und zu homogenisieren.

• Inkonsistenzen in Daten und Metadaten auszugleichen.

• Doppelte/redundante Informationen zu entfernen.

• Fehlende Informationen zu ergänzen.

• Sicherzustellen, dass die Informationen aktuell sind.

Bereinigung Ihrer Daten & Metadaten

Folie 28

Siehe auch: http://www.slideshare.net/OpenDataSupport/introduction-to-rdf-sparql Cleanse your data with Open Refine (Google Refine) - https://code.google.com/p/google-refine/

Page 29: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Unternehmensname Datum der Registrierung Land E-Mail # Niederlassungen

Niké 1991-04-28 Belgium niké 7

BARCO 15 September 1986 BE [email protected] 2

Niké België

Coca-Cola United States [email protected] 3

Datenbereinigung – Ein Beispiel

Folie 29

Formatierungs-problem

Fehlende Information

Duplikat Fehler

Redundante Information Widersprüchliche

Informationen

Unternehmensname Datum der Registrierung Land E-Mail

Niké 1991-04-28 BE niké@sport.org

BARCO 1986-09-05 BE [email protected]

Coca-Cola 1964-03-26 US [email protected]

Bereinigungs-operationen

Page 30: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Modellieren Sie Ihre Metadaten

Das DCAT Anwendungsprofil für Datenportale in Europa (DCAT-AP) ist eine Spezifikation, die auf dem Datenkatalogvokabular (DCAT) zur Beschreibung der Datensätze des öffentlichen Sektors in Europa basiert.

DCAT-AP verbessert das Auffinden von Datensätzen des öffentlichen Sektors sowohl grenz- als auch sektorenüberschreitend.

Folie 30

Siehe auch: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

Page 31: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Verwenden Sie zur Namensgebung persistente Uniform Resource Identifiers (URI)

Folie 31

i.e. independent of the data originator

e.g. http://www.example.com/id/alice_brown

e.g. http://education.data.gov.uk/ministryofeducation/id/school/123456

e.g. http://education.data.gov.uk/doc/school?id=123456

e.g. http://education.data.gov.uk/doc/school/v01/123456

e.g. http://education.data.gov.uk/id/school1/123457

e.g. http://education.data.gov.uk/id/school1/123456

e.g. http://data.example.org/doc/foo/bar.rdf

e.g. http://data.example.org/doc/foo/bar.html

e.g. http://education.data.gov.uk/id/school/123456

e.g. http://{domain}/{type}/{concept}/{reference}

Follow the pattern

Re-use existing identifiers

Link multiple representations

Implement 303 redirects for real-world objects

Use a dedicated service

Avoid stating ownership

Avoid version numbers

Avoid using auto-increment

Avoid query strings

rulesfor persistent

http://education.data.gov.uk/doc/schools/123456.csv

Avoid file extensions

Siehe auch: http://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-uris https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent-uris

Persistente URIs bilden die Grundlagen für Linked Data.

Page 32: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Bei der Lizensierung Ihrer Daten und Metadaten geht es darum:

• Potenzielle Wiederverwender darüber zu informieren, wie Daten und Metadaten (wieder-)verwendet und/oder angepasst werden können;

• Ihre Daten und Metadaten mit Lizenzinformationen zu verbinden: Sollten diese fehlen ist das ein großes Hindernis für die Weiterverwendung der Daten und senkt den Mehrwert, den die Veröffentlichung Ihrer Daten generiert.

• Dass Open Data, per Definition, unter einer offenen Lizenz veröffentlicht werden sollten.

• Dass Metadaten unter einer Lizenz veröffentlicht werden sollten, die anzeigt, dass sie Allgemeingut sind. Damit fördern Sie die Weiterverwendung und die Auffindbarkeit Ihrer Daten.

Folie 32

Siehe auch: http://www.slideshare.net/OpenDataSupport/licence-your-data-metadata

Page 33: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Offene Lizenzen

• Creative Commons (CC) (http://creativecommons.org/licenses/)

- Attribution (BY): Der Schöpfer des Werkes sollte erwähnt werden.

- Non Commercial (NC): Das Werk kann nicht für kommerzielle Zwecke verwendet werden.

- No Derivatives (ND): Das Werk kann nicht auf andere Werke angepasst oder mit diesen vereint werden.

- Share Alike (SA): Das Werk kann angepasst werden, muss aber derselben Lizenz zugeschrieben werden, wenn Sie es verfügbar machen.

- CC Zero (CC0): Das Werk ist Allgemeingut.

• Open Data Commons (http://opendatacommons.org/licenses/)

- „Open Data Commons Attribution Licence (ODC-By): kompatibel mit CC BY

- Open Data Commons Open Database Licence (ODC-ODbL): kompatibel mit CC BY SA

- Public Domain Dedication Licence (PDDL): kompatibel mit CC Zero

• The Open Government Licence (http://www.nationalarchives.gov.uk/doc/open-government-licence/)

Folie 33

Siehe auch: http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf

Page 34: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Bei der Veröffentlichung von Linked Data geht es darum...

… Strukturen aufzubrechen, um dadurch Mehrwerte zu schaffen.

• Machen Sie Ihre Daten und Metadaten öffentlich und im Internet leicht zugänglich.

• Verknüpfen Sie Ihre Daten und Metadaten mit anderen Daten (oder Metadaten), um:

ihnen mehr Bedeutung und Inhalt zu geben;

sie in einen Kontext zu stellen;

sie zu bereichern;

Nutzern zu erlauben, immer mehr zu entdecken.

Folie 34

Page 35: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Stellen Sie einen SPARQL Endpunkt bereit

Ein SPARQL Endpunkt ist ein Dienst, der es Anderen erlaubt Ihre Linked Data (und/oder Metadaten) abzufragen.

Folie 35

http://data.opendatasupport.eu

Page 36: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Die Veröffentlichung Ihrer Metadaten

Veröffentlichen Sie Ihre Metadaten auf einem zentralen Datenbroker, um ihnen mehr Sichtbarkeit zu geben und um die Weiterverwendung Ihrer Datensätze zu verbessern.

Folie 36

Siehe auch: http://www.slideshare.net/OpenDataSupport/promoting-the-re-use-of-open-data-through-odip

The Open Data Interoperability Platform (ODIP):

• ODIP ist ein zentraler Datenbroker, der von der Europäischen Kommission entwickelt wurde, um die grenzüberschreitende europäische Suche nach Datensätzen zu ermöglichen.

• ODIP ermöglicht es Datenherausgebern und Datenportalen, Beschreibungsmetadaten für Datensätze zentral zu veröffentlichen.

Page 37: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Beim Daten- & Metadatenmanagement geht es darum...

• Den Lebenszyklus der Daten zu verwalten: Datensätze zu erstellen, zu aktualisieren, instand zu halten und stillzulegen.

• Den Lebenszyklus der Metadaten zu verwalten.

• Prozesse zu implementieren, die sicherstellen, dass Ihre Daten und Metadaten über ein angemessenes Qualitätsniveau verfügen.

• Die Besitzverhältnisse für Daten(-sätze) und Metadaten festzulegen.

Folie 37

Siehe auch: http://www.slideshare.net/OpenDataSupport/introduction-to-metadata-management

Page 38: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Sammeln Sie Feedback von den Wiederverwendern Ihrer Daten

Bitten Sie die (potenziellen) Verwender der Daten um ihr Feedback:

• Welche Daten brauchen sie.

• Wie haben sie die Daten genutzt.

• Was dachten sie über die Qualität.

• Stellen Sie sicher, dass Anfragen und Korrekturen Sie erreichen: Crowdsourcen Sie die Datenqualität!

Folie 38

data.overheid.nl

data.gov.uk

Page 39: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

LOGD-Nachfrage Die Nachfrage von Unternehmen, Unternehmern, Forschern und Regierungen nach Linked Data

Folie 39

Page 40: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Bei der Nachfrageseite des LOGD-Lebenszyklus geht es darum...

Es Datenwiederverwendern zu ermöglichen:

• Passende Datensätze zu finden;

• Datensätze für Analysezwecke und die Entwicklung von Anwendungen und Diensten zu nutzen;

• Zu wissen, was ihre Regierung tut (Transparenz);

• Kosten zu sparen.

Folie 40

Entwickler/Unternehmen integrieren Daten in Anwendungen (Services)

Öffentliche Verwaltungen teilen ihre Daten online

Bürger/Unternehmen profitieren von den Anwendungen (Services)

Entwickler/ Unternehmen suchen nach Daten

Veröffentlichung von Daten

Weiterverwendung von Daten

Page 41: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Wo kann man Datensätze finden?

Datensätze werden auf verschiedenen Plattformen verfügbar gemacht, die über ganz Europa verteilt sind.

“Ein Datenbroker sammelt die Metadaten von verschiedenen Open Data Plattformen und veröffentlicht sie in einem gemeinsamen Metadatenmodell. Auf diese Weise können die Datensätze auf eine einheitliche Weise von einem einzelnen Zugangspunkt abgefragt werden.”

• Lokale Open Data Portale, z.B.

- opendatamanchester.org.uk

- Data.gent.be

• Regionale Open Data Portale z.B.

- opendata.regionpaca.fr

- Open public data of the government of Catalonia

• Nationale Open Data Portale, z.B.

- Opendata.at

- opendata.lu

• Europäische Open Data Portale, z.B.

- Open-data.europa.eu

• Open Data Broker, z.B.

- Publicdata.eu

- ODIP

Folie 41

Page 42: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Verwenden Sie den SPARQL-Endpunkt oder einen Faceted Browser, um Datensätze zu finden

Ein Benutzer kann eine SPARQL-Abfrage über einen SPARQL-Endpunkt ausführen um Datensätze zu finden oder sich einen Weg durch die Sammlung von Datensätzen zu „filtern“, die einen Faceted Browser verwenden.

Folie 42

SPARQL-Endpunkt Facettierter Browser

http://data.gov.uk/sparql

http://data.gov.uk/data/search

Page 44: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Veröffentlichung von LoGD mittels

Open Refine

Folie 44

Page 45: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Modellierung und Veröffentlichung von Open Data mittels Open Refine Erste Schritte

1. Installieren Sie Open Refine: https://github.com/OpenRefine

2. Installieren Sie die RDF-Erweiterung: http://refine.deri.ie/

Und dann...

Beschreiben Sie Ihre Daten in einer Tabelle.

Erstellen Sie ein Projekt und laden Sie es in Open Refine hoch.

Bilden Sie Ihre Daten auf entsprechende RDF Klassen &

Eigenschaften ab.

Exportieren Sie die Daten nach RDF.

Folie 45

1

2

3

4

Page 46: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Beschreiben Sie Ihre Daten in einer Tabelle

Folie 46

Unternehmensname Datum der Registration Land E-Mail

Nikè 1991-04-28 BE niké@sport.org

BARCO 1986-09-05 BE [email protected]

Coca-Cola 1964-03-26 US [email protected]

1

Page 47: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Erstellen Sie ein Projekt und laden Sie es in Google Refine hoch

Folie 47

2

Laden Sie die Tabelle hoch

Wählen Sie die entsprechenden Tabs

Erstellen Sie das Projekt

Page 48: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Bilden Sie Ihre Daten auf entsprechende RDF Klassen & Eigenschaften ab (modellieren Sie Ihre Daten).

Folie 48

3

Definieren Sie ein Grundgerüst, um die Daten Ihrer Tabelle in RDF umzuwandeln.

Page 49: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Exportieren Sie Ihre Daten nach RDF/XML oder Turtle

Folie 49

4

Page 50: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Der LOD2-Stack Werkzeuge zur Veröffentlichung und Abfrage von LOGD

Folie 50

Page 51: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Veröffentlichen Sie Ihre Daten mit dem LOD2 Stack

„Der LOD2-Stack ist eine integrierte Sammlung von aufeinander abgestimmten Werkzeugen, die den Lebenszyklus von Linked (Open) Data durch Extraktion, Verfassen/Erstellen über Anreicherung, Verknüpfung, Verschmelzung bis zur Visualisierung und Instandhaltung unterstützen. Der Stack umfasst Werkzeuge von LOD2 Partnern und Dritten.”

Folie 51

Source: [http://stack.lod2.eu/]

Page 52: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Silk – Ein Werkzeug für die Verknüpfung Ihrer Daten

“Das Silk-Framework ist ein Instrument um Beziehungen zwischen Datenelementen verschiedener Linked Data Quellen zu finden. Datenherausgeber können Silk dazu verwenden RDF-Links von ihren Datenquellen zu anderen Datenquellen im Internet zu setzen.“

Download und weitere Informationen:

http://wifo5-03.informatik.uni-mannheim.de/bizer/silk

Folie 52

Page 53: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Schlussfolgerungen

• Der LOGD- und Metadatenlebenszyklus sollte sich sowohl mit der Angebots- als auch mit der Nachfrageseite befassen.

• Die Auswahl der Daten und Metadaten, die veröffentlicht werden sollen, sollte verschiedene Dimensionen in Betracht ziehen.

• Bei der Modellierung geht es darum, die Daten und Metadaten zu strukturieren und eine angemessene Qualitätsebene zu erreichen.

• Bei der Veröffentlichung geht es darum, die Daten und Metadaten öffentlich, leicht zugänglich und durchsuchbar zu machen.

• Das Daten- und Metadatenmanagement sollte sicherstellen, dass Prozesse und Richtlinien existieren, die den Lebenszyklus der Daten und Metadaten steuern.

• Der Datenherausgeber sollte die nötigen Instrumente liefern, um Feedback von den Datenwiederverwendern zu erhalten, um dadurch die Nachfrage und Crowdsourcing Qualität nachzuvollziehen.

• Es gibt mehrere Werkzeuge für die Entwicklung und Veröffentlichung von LOGD, aber nur wenige sind von einer produktionsreifen Qualität.

Folie 53

Page 54: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Gruppenfragen

Folie 54

Haben Sie auf betrieblicher Ebene eine Daten- und/oder Metadatenverwaltungsmethodik?

Existieren Angebot und Nachfrage für LOGD in Ihrem Land? Wenn ja, wer liefert was an wen?

Was sind, Ihrer Meinung nach, die größten Hindernisse bei der Bereitstellung von LOGD in Ihrem Land?

http://www.visualpharm.com

http://www.visualpharm.com

http://www.visualpharm.com

Machen Sie auch den Online-Test!

Page 55: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Vielen Dank! ...und jetzt IHRE Fragen?

Folie 55

Page 56: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Referenzen

Folie 5:

• GLD Life cycle. W3C. http://www.w3.org/2011/gld/wiki/GLD_Life_cycle

Folie 8:

• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

Folie 14:

• United Nations Statistics Division. COFOG (Classification of the Functions of Government). http://unstats.un.org/unsd/cr/registry/regcst.asp?Cl=4

Folie 21:

• Characterization Study of the Infomediary Sector - 2012 Edition. Datos.gob.es. http://datos.gob.es/datos/sites/default/files/files/Estudio_infomediario/121001%20RED%20007%20Final%20Report_2012%20Edition_vF_en.pdf

Folie 21:

• http://data.gov.uk/data

• http://publicdata.eu/

• http://open-data.europa.eu/en/data/dataset

Folie 21:

• http://data.gov.uk/data/site-usage/publisher?month=

• http://data.gov.uk/data/site-usage/dataset

Folien 24-25:

• Cookbook for translating Data Models to RDF Schemas. IAS Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

Folie 26:

• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure

Folie 27:

• http://lov.okfn.org/

Folie 29:

• DCAT application profile for data portals in Europe. ISA Programme. https://joinup.ec.europa.eu/asset/dcat_application_profile/description

Folie 31:

• 10 Rules for Persistent URIs. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent-uris

Folien 32-33:

• Licensing Open Data: A Practical Guide. Naomi Korn and Professor Charles Oppenheim. http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf

Folie 51:

• Announcement of intermediate LOD2 Stack release, March 2012. Martin Kaltenboeck. http://lod2.eu/BlogPost/1034-announcement-of-intermediate-lod2-stack-release-march-2012.html

Folie 52:

• Silk - A Link Discovery Framework for the Web of Data. University of Mannheim. http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/

Folie 56

Page 57: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Weiterführende Literatur (1/2)

Linked Data Cookbook. W3C.

http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

Cookbook for translating Data Models to RDF Schemas. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

Publishing Open Government Data. Daniel Bennett & Adam Harvey. http://www.w3.org/TR/gov-data/

N. Korn & C. Oppenheim, Licensing Open Data: A Practical Guide.

http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf

Folie 57

Page 58: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Weiterführende Literatur (2/2)

Linked Open Data: The Essentials. Florian Bauer, Martin Kaltenböck.

http://www.semantic-web.at/LOD-TheEssentials.pdf

Linked Data: Evolving the Web into a Global Data Space. Tom Heath and Christian Bizer.

http://linkeddatabook.com/editions/1.0/

Linked Open Government Data. Li Ding Qualcomm, Vassilios Peristeras and Michael Hausenblas.

http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6237454

EUCLID - Course 1: Introduction and Application Scenarios

http://www.euclid-project.eu/modules/course1

Folie 58

Page 59: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Verwandte Projekte und Initiativen (1/2)

LOD2 Technology Stack, http://stack.lod2.eu/

Open Data Publishing Pipeline DERI, http://sw.deri.ie/content/odpp

W3C Linked Data Cookbook, http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

Cookbook for translating Data Models to RDF Schemas, https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

Folie 59

Page 60: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Verwandte Projekte und Initiativen (2/2)

EUCLID FP7 Project, http://projecteuclid.org/

LOD Around The Clock FP7 project, http://latc-project.eu/

Generic Statistical Business Process Model, http://www1.unece.org/stat/platform/display/GSBPM/Generic+Statistical+Business+Process+Model+Paper

Folie 60

Page 61: Der Lebenszyklus von Linked Offenen Regierungsdaten

DATASUPPORTOPEN

Werden Sie Teil unseres Teams...

Folie 61

Besuchen Sie uns

Kontaktieren Sie uns

Lernen Sie uns kennen

Folgen Sie uns

Open Data Support http://www.slideshare.net/OpenDataSupport

http://www.opendatasupport.eu Open Data Support http://goo.gl/y9ZZI

@OpenDataSupport [email protected]