Top Banner
Linked Data für die semantische Integration von VRE Daten Stefan Dietze L3S Research Center - Herder Institut, 18.3.2015 - 18/03/15 1 Stefan Dietze
16

Dietze linked data-vr-es

Jul 18, 2015

Download

Technology

Stefan Dietze
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Dietze linked data-vr-es

Linked Data für die semantische

Integration von VRE Daten

Stefan Dietze

L3S Research Center

- Herder Institut, 18.3.2015 -

18/03/15 1 Stefan Dietze

Page 2: Dietze linked data-vr-es

Aktuelle Anwendungsschwerpunkte

Anwendungs- & Forschungsdaten Architektur/Cultural Heritage

DURAARK und verwandte Initiativen

Daten für Bildung und Bildungsforschung:

W3C Community Group on Linked Open Education

LinkedUp / Data Catalog

Research areas

Web science, Information Retrieval, Semantic Web & Linked Data, data & knowledge integration

Anwendungsdomänen: TEL/Education, Web archiving, scientific data management

Einige Projekte

Introduction

http://www.l3s.de/

18/03/15 2

See also: http://purl.org/dietze

Stefan Dietze

Page 3: Dietze linked data-vr-es

Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”

18/03/15 3 Stefan Dietze

Page 4: Dietze linked data-vr-es

Google Knowledge Graph

Strukturiertes Faktenwissen aus z.B. DBpedia, Freebase etc.

Repräsentiert im standardisierten, maschinen-lesbaren Format „RDF“ (Resource Description Framework)

dbp:United_States

http://dbpedia.org/resource/Cambridge_MA

dbp:W3C

country

cityOf

dbp:MIT

ru.dbp:Кембридж_(Массачусетс)

sameAs

headquarterOf

Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”

18/03/15 4 Stefan Dietze

Page 5: Dietze linked data-vr-es

Semantic Web/Linked Data

Gesamtheit “aller” RDF Datasets

Linked Data Prinzipien: RDF, SPARQL und URIs

Linked Data Cloud: vernetzter Graph aus offenen Web Daten (500+ Datasets and 100 Mrd RDF Statements)

dbp:United_States

http://dbpedia.org/resource/Cambridge_MA

dbp:W3C

country

cityOf

schema:City

typeOf

dbp:MIT

ru.dbp:Кембридж_(Массачусетс)

sameAs

headquarterOf

Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”

18/03/15 5 Stefan Dietze

geonames:4931972

sameAs

Page 6: Dietze linked data-vr-es

Linked Data für Architektur/Cultural Heritage?

18/03/15 Stefan Dietze 6

RDF Vokabulare

Kontext/Hintergrundwissen:

Geodaten und Geokontext

Historie

Statistische Daten etc

Gadiraju, U., Kawase, R., Dietze, S., Extracting

Architectural Patterns from Web data, in Proceedings of

13th International Semantic Web Conference (ISWC2014),

Riva Del Garda, Italy, October 2014 [ Best ISWC2014

Poster Award ]

Page 7: Dietze linked data-vr-es

DURAARK Consortium

18/03/15 Stefan Dietze 7

http://www.duraark.eu

Goals

Semantische Anreicherung und Archivierung von Architekturdaten (3D Models, Metadata, relevante Web Daten/Linked Data)

“DURAARK: Durable Architectural Knowledge”in a

Page 8: Dietze linked data-vr-es

Herausforderungen

Diverse Stakeholder: Architekten, Cultural Heritage Experten/Forscher, Urban Planner

Diverse und “evolving” Daten: low-level Point Clouds & Legacy 3D Modelle, Building Information Models (BIM), abstraktere semantische Informationen & Vokabulare

Komplexe Kontextinformation zu: Infrastruktur, Historie, gesetzlichen Rahmenbedingungen, Umwelt, etc

Automatisierte “Semantische Anreicherung” von Architekturwissen: (Linked) Web Data zur Anreicherung, Verlinkung, Disambiguierung

Archivierung und temporale Analyse

Building Data Web Data and Vocabularies

“DURAARK: Durable Architectural Knowledge”in a

18/03/15 Stefan Dietze 8

Page 9: Dietze linked data-vr-es

DURAARK Ergebnisse: Daten & Interface

“DURAARK Workbench”

18/03/15 Stefan Dietze 9

“Semantic Digital Archive” (analog zu WissKI/Graph Database)

RDF Vokabulare (BuildM, IFCM etc)

“BuildM Schema”: RDF Vokabular (ähnlich CHML), aligned mit schema.org, FOAF, DBpedia ontology, Geonames

http://data.duraark.eu/sparql

http://data.duraark.eu/vocab/buildm

http://workbench.duraark.eu

Page 10: Dietze linked data-vr-es

DURAARK Ergebnisse: Methoden, Tools, Komponentenutshell

18/03/15 Stefan Dietze 10

Geometric Enrichment: Detection von Shapes und Structures

Point Clouds/CAD => IFC

Semantic Enrichment Methoden

Focused Crawling von Linked Data

Langzeitarchivierung

Page 11: Dietze linked data-vr-es

LinkedUp-Herausforderung: Suche nach Daten

Stefan Dietze 18/03/15

? ? ?

Domäne/Disziplin: Welche Datasets/Ressourcen nützlich für Thema XY (z.B. „Astronomy“) ?

Ressourcen Typen: Welche Datasets beinhalten statistische Daten, bibliogr. Ressourcen, AV Material, Publikationen?

Links: Welche Datasets/Ressourcen sind ähnlich?

Qualität: Aktualität, Dynamik, Erreichbarkeit, Korrektheit

11

http://www.linkedup-project.eu/

Page 12: Dietze linked data-vr-es

“LinkedUp Catalog”: Daten für Bildung & Bildungsforschung

Automatische Extraktion von Dataset Metadata

[WebSci2013, ESWC2013, ESWC2014]

Stefan Dietze 18/03/15 12

Dataset

Catalog/Registry

Kuratierung existierender Datasets (z.B. OER, bibliographische Daten, University Data)

Veröffentlichung neuer Linked Datasets mit Content Anbietern (z.B. Elsevier, ACM, SoLAR)

http://data.linkededucation.org/linkedup/catalog/

LinkedUp Catalog: umfangreichste Zusammenstellung von LD/Open Data für Bildung und Bildungsforschung (ca. 50 Datasets)

Automatisierte Anreicherung mit Hintergrundwissen & Links

The LinkedUp Data Catalogue: A Meta-Dataset of Linked

Datasets in the Education Domain, d'Aquin, M., Adamou, A.,

Dietze, S., Fetahu, B., Semantic Web Journal, under review.

.

Page 13: Dietze linked data-vr-es

LinkedUp Catalog: Federated Search, Automatische Annotationen in a nutshell

“Federated Queries” durch Schema Mappings

Automatisierte Kategorisierung & Metadaten („Topics“)

Stefan Dietze 18/03/15 13

http://data.linkededucation.org/linkedup/catalog/

Topics: DBpedia Kategorien

Page 14: Dietze linked data-vr-es

Beispiel “LAK Dataset”

Forschungsressourcen in Kooperation mit

Linked Data Corpus aller relevanten „Learning Analytics“ und „Educational Data Mining“ Publikationen (5 Jahre, relevante Journals & Konferenzen, ca. 800 Publikationen)

Metadaten und Voll-Text als Linked Data (direkte Verlinkung mit Forschungsdaten in Arbeit)

Genutzt in Vielzahl von Anwendungen; LAK Data Challenge: http://lak.linkededucation.org

Facilitating Scientometrics in Learning Analytics and Educational

Data Mining - the LAK Dataset, Taibi, D., Dietze, S., D’Aquin,

Semantic Web Journal (accepted with minor revisions), 2014.

Proceedings of the LAK Data Challenge 2014, held at the 4th

Conference on Learning Analytics and Knowledge (LAK2014), Eds.:

Drachsler, H., Dietze, S., d’Aquin, M., Herder, E., Taibi, D.,, CEUR

Workshop Proceedings, Vol. 1137, 2014.

18/03/15 Stefan Dietze

Journals &

conference

proceedings

RDF

„5-Star“ Linked Data

14

Page 15: Dietze linked data-vr-es

Zusammenfassung: Linked Data & VRE’s in a nutshell

Zusammenfassung

Linked Data/Semantic Web für Datenrepräsentation und Nutzung in VREs

Zahlreiche verwandte Tools (Text Mining, NER etc),

(Verlinkte) Vokabulare und Datasets, speziell für Forschungsinformationen und Domänenwissen

Beispiele: DURAARK Semantic Digital Archive (SDA), LAK Dataset, LinkedUp Data Catalog

Relevante Links – Linked Data in Architecture

DURAARK => http://duraark.eu

W3C Community Group on Linked Building Data => https://www.w3.org/community/lbd/

DURAARK „SDA“ => http://data.duraark.eu/sparql

Relevante Links – Linked Data (allgemein, Forschungsdaten/Bildung)

LinkedUp Data Catalog => http://data.linkededucation.org/linkedup/catalog/

W3C Community Group on Linked Data in Eductaion => https://www.w3.org/community/opened/

18/03/15 Stefan Dietze 15

Page 16: Dietze linked data-vr-es

16 Stefan Dietze 18/03/15

Vielen Dank für Ihre Aufmerksamkeit!

Weitere Links

http://purl.org/dietze

http://www.l3s.de

http://data.l3s.de