DATA SUPPORT OPEN Trainingsmodul 2.1 Der Lebenszyklus von Linked Open Government Data & Metadata Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.com PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.
61
Embed
Trainingsmodul 2.1 Der Lebenszyklus von Linked Open Government Data & Metadata Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
DATASUPPORT
OPEN
Trainingsmodul 2.1
Der Lebenszyklus von Linked Open Government Data & Metadata
Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.comPwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.
Autoren: Michiel De Keyzer, Nikolaos Loutas and Stijn Goedertier
Metadaten der Präsentation
Folie 2
Disclaimer
1.Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden.Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission.Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind.
2.Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.
Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE-0530965/00-17) finanziert.
“Metadaten sind strukturierte Informationen, die beschreiben, erklären, lokalisieren, oder es anderweitig einfacher machen, eine Informationsquelle abzurufen, zu verwenden oder zu verwalten. Daten zu bestimmten Daten oder Informationen zu bestimmten Informationen werden oft Metadaten genannt.” -- National Information Standards Organization
LOGD & Metadaten AngebotVerwaltungen, die ihre Daten öffentlich machen und sie als Linked Data zusammen mit den entsprechenden Metadatenbeschreibungen veröffentlichen
Mehrere Dimensionen können im Auswahlprozess von LOGD berücksichtigt werden, sowohl aus der Sicht des Herausgebers als auch des Wiederverwenders.
• Transparenz: Erhöht die Veröffentlichung des Datensatzes die Transparenz und die Offenheit der Verwaltung gegenüber ihren Bürgern?
• Gesetzliche Anforderungen: Gibt es ein Gesetz, das die Veröffentlichung verpflichtend macht oder gibt es keine solche Auflage?
• Verbindung mit öffentlicher Aufgabe: Sind die Daten das direkte Ergebnis einer Kernaufgabe der Verwaltung oder sind sie ein Produkt einer nicht wesentlichen Aktivität?
• Aktueller Stand der Veröffentlichung: Sind die Daten bereits öffentlich verfügbar oder müssen sie noch veröffentlicht werden?
• Art des Mehrwerts: Sind die Daten für soziale Zwecke nützlich oder haben sie kommerziellen Wert?
• Zielgruppe: Sind die Daten in erster Linie für die Öffentlichkeit oder für eine Back-Office-Integration bestimmt?
Auswahl aufgrund eines Bezugs zur öffentlichen Aufgabe
Einige Daten können das direkte Ergebnis der primären öffentlichen Verwaltungsaufgabe sein, beispielsweise die Funktionen, die in COFOG aufgeführt sind, z.B.:
• Öffentliche Ordnung und Sicherheit.• Umweltschutz.• Gesundheit.• Kultur.• Bildung.
Andere von der Verwaltung produzierte Daten sind unwesentlich (sie können vom privaten Sektor geliefert werden; und werden dies auch manchmal), z.B.:• Kartierung zu Navigationszwecken (siehe Google Street View)• Wettervorhersage (z.B. Internetseiten zum Wetter)
Einige Daten sind bereits offen und elektronisch verfügbar, z.B. (in einigen Ländern):
• Katasterinformationen.
• Topographische Karten.
• Verkehrsinformationen.
• Wettervorhersagen.
Andere Daten können weiterhin der Öffentlichkeit vorenthalten werden (vielleicht weil es sehr schwer ist, sie zu veröffentlichen, weil sie persönliche oder vertrauliche Daten beinhalten oder weil sie teilweise der Lizenzierung durch Dritte unterliegen).
Hoher Mehrwert aus der Perspektive eines Wiederverwenders
Aus der Sicht eines Wiederverwenders, hängt der Mehrwert eines Datensatzes vor allem von seinem Verwendungs- und Wiederverwendungspotenzial ab, das effektiv zur Erschließung von (neuen) Geschäftsmodellen führen kann.
Das Verwendungs- und Wiederverwendungspotenzial eines Datensatzes wird bestimmt durch:
•Die Größe und die Dynamik der Zielgruppe des Datensatzes; sowie
•Die Anzahl der neuen und bestehenden Systeme und Dienstleistungen, die den
Datensatz benutzen.
Die Öffnung von Datensätzen mit einem hohen Verwendungs- und Wiederverwendungspotenzial führt zur Schaffung neuer Produkte und/oder Dienstleistungen, die un- oder mittelbare wirtschaftliche oder soziale Auswirkungen und/oder positive wirtschaftliche Externalitäten haben.
Auswahl aufgrund der Bedürfnisse der ZielgruppeWas für Daten brauchen/wollen die Wiederverwender?Laut einer spanischen Studie werden die folgenden Arten von Informationen von Unternehmen am meisten wiederverwendet:
Damit stellen Sie sicher, dass Daten und Metadaten auf einem angemessenen Qualitätsniveau und mit möglichst wenig Fehlern veröffentlicht werden können.
Das bedeutet:
•Fehler festzustellen.
•Formate zu transformieren und zu homogenisieren.
•Inkonsistenzen in Daten und Metadaten auszugleichen.
•Doppelte/redundante Informationen zu entfernen.
•Fehlende Informationen zu ergänzen.
•Sicherzustellen, dass die Informationen aktuell sind.
Bereinigung Ihrer Daten & Metadaten
Folie 28
Siehe auch:http://www.slideshare.net/OpenDataSupport/introduction-to-rdf-sparqlCleanse your data with Open Refine (Google Refine) - https://code.google.com/p/google-refine/
Das DCAT Anwendungsprofil für Datenportale in Europa (DCAT-AP) ist eine Spezifikation, die auf dem Datenkatalogvokabular (DCAT) zur Beschreibung der Datensätze des öffentlichen Sektors in Europa basiert.
DCAT-AP verbessert das Auffinden von Datensätzen des öffentlichen Sektors sowohl grenz- als auch sektorenüberschreitend.
Bei der Lizensierung Ihrer Daten und Metadaten geht es darum:
• Potenzielle Wiederverwender darüber zu informieren, wie Daten und Metadaten (wieder-)verwendet und/oder angepasst werden können;
• Ihre Daten und Metadaten mit Lizenzinformationen zu verbinden: Sollten diese fehlen ist das ein großes Hindernis für die Weiterverwendung der Daten und senkt den Mehrwert, den die Veröffentlichung Ihrer Daten generiert.
• Dass Open Data, per Definition, unter einer offenen Lizenz veröffentlicht werden sollten.
• Dass Metadaten unter einer Lizenz veröffentlicht werden sollten, die anzeigt, dass sie Allgemeingut sind. Damit fördern Sie die Weiterverwendung und die Auffindbarkeit Ihrer Daten.
Veröffentlichen Sie Ihre Metadaten auf einem zentralen Datenbroker, um ihnen mehr Sichtbarkeit zu geben und um die Weiterverwendung Ihrer Datensätze zu verbessern.
• ODIP ist ein zentraler Datenbroker, der von der Europäischen Kommission entwickelt wurde, um die grenzüberschreitende europäische Suche nach Datensätzen zu ermöglichen.
• ODIP ermöglicht es Datenherausgebern und Datenportalen, Beschreibungsmetadaten für Datensätze zentral zu veröffentlichen.
Datensätze werden auf verschiedenen Plattformen verfügbar gemacht, die über ganz Europa verteilt sind.
“Ein Datenbroker sammelt die Metadaten von verschiedenen Open Data Plattformen und veröffentlicht sie in einem gemeinsamen Metadatenmodell. Auf diese Weise können die Datensätze auf eine einheitliche Weise von einem einzelnen Zugangspunkt abgefragt werden.”
Verwenden Sie den SPARQL-Endpunkt oder einen Faceted Browser, um Datensätze zu findenEin Benutzer kann eine SPARQL-Abfrage über einen SPARQL-Endpunkt ausführen um Datensätze zu finden oder sich einen Weg durch die Sammlung von Datensätzen zu „filtern“, die einen Faceted Browser verwenden.
„Der LOD2-Stack ist eine integrierte Sammlung von aufeinander abgestimmten Werkzeugen, die den Lebenszyklus von Linked (Open) Data durch Extraktion, Verfassen/Erstellen über Anreicherung, Verknüpfung, Verschmelzung bis zur Visualisierung und Instandhaltung unterstützen. Der Stack umfasst Werkzeuge von LOD2 Partnern und Dritten.” Folie 51
Silk – Ein Werkzeug für die Verknüpfung Ihrer Daten
“Das Silk-Framework ist ein Instrument um Beziehungen zwischen Datenelementen verschiedener Linked Data Quellen zu finden.Datenherausgeber können Silk dazu verwenden RDF-Links von ihren Datenquellen zu anderen Datenquellen im Internet zu setzen.“
• Der LOGD- und Metadatenlebenszyklus sollte sich sowohl mit der Angebots- als auch mit der Nachfrageseite befassen.
• Die Auswahl der Daten und Metadaten, die veröffentlicht werden sollen, sollte verschiedene Dimensionen in Betracht ziehen.
• Bei der Modellierung geht es darum, die Daten und Metadaten zu strukturieren und eine angemessene Qualitätsebene zu erreichen.
• Bei der Veröffentlichung geht es darum, die Daten und Metadaten öffentlich, leicht zugänglich und durchsuchbar zu machen.
• Das Daten- und Metadatenmanagement sollte sicherstellen, dass Prozesse und Richtlinien existieren, die den Lebenszyklus der Daten und Metadaten steuern.
• Der Datenherausgeber sollte die nötigen Instrumente liefern, um Feedback von den Datenwiederverwendern zu erhalten, um dadurch die Nachfrage und Crowdsourcing Qualität nachzuvollziehen.
• Es gibt mehrere Werkzeuge für die Entwicklung und Veröffentlichung von LOGD, aber nur wenige sind von einer produktionsreifen Qualität.
•GLD Life cycle. W3C. http://www.w3.org/2011/gld/wiki/GLD_Life_cycle
Folie 8:
• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Folie 14:
• United Nations Statistics Division. COFOG (Classification of the Functions of Government). http://unstats.un.org/unsd/cr/registry/regcst.asp?Cl=4
Folie 21:
• Characterization Study of the Infomediary Sector - 2012 Edition. Datos.gob.es. http://datos.gob.es/datos/sites/default/files/files/Estudio_infomediario/121001%20RED%20007%20Final%20Report_2012%20Edition_vF_en.pdf
• Cookbook for translating Data Models to RDF Schemas. IAS Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Folie 26:
• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure
Folie 27:
• http://lov.okfn.org/
Folie 29:
• DCAT application profile for data portals in Europe. ISA Programme. https://joinup.ec.europa.eu/asset/dcat_application_profile/description
Folie 31:
• 10 Rules for Persistent URIs. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent-uris
Folien 32-33:
• Licensing Open Data: A Practical Guide. Naomi Korn and Professor Charles Oppenheim. http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf
Folie 51:
• Announcement of intermediate LOD2 Stack release, March 2012. Martin Kaltenboeck. http://lod2.eu/BlogPost/1034-announcement-of-intermediate-lod2-stack-release-march-2012.html
Folie 52:
• Silk - A Link Discovery Framework for the Web of Data. University of Mannheim. http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/
Cookbook for translating Data Models to RDF Schemas. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Publishing Open Government Data. Daniel Bennett & Adam Harvey. http://www.w3.org/TR/gov-data/
N. Korn & C. Oppenheim, Licensing Open Data: A Practical Guide.