Top Banner
PasDas Summit 2016 Thomas Kurz 2016/10/04 Passau, Deutschland Suche – ein effizientes Mittel zur Datenintegration
38

Suche ein effizientes Mittel zur Datenintegration

Jan 19, 2017

Download

Internet

Thomas Kurz
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Suche ein effizientes Mittel zur Datenintegration

PasDas Summit 2016 Thomas Kurz

2016/10/04Passau, Deutschland

Suche – ein effizientes Mittel zur Datenintegration

Page 2: Suche ein effizientes Mittel zur Datenintegration

Redlink wurde 2013 gegündet und hat seinen Sitz in , Österreich.SALZBURG

SuchlösungenTextanalyse Apps

Daten verstehen Daten organisieren Daten nutzen

Page 3: Suche ein effizientes Mittel zur Datenintegration

Kunden & Partner

Page 4: Suche ein effizientes Mittel zur Datenintegration

04/36

"We are drowning in information and starved for knowledge."John Naisbitt

Suche als effizienter, zentraler Zugang zu Informationen und Daten

• Digitale Inhalte sind immer und überall abrufbar

• Inhalte sind oft unstrukturiert

• Information sind über Personen, Systeme und

Dokumente verteilt

Page 5: Suche ein effizientes Mittel zur Datenintegration

Suche als Informationsteleskop

Contextualisierte Suchen erlauben unterschiedliche (spezielle)Blickwinkel auf Daten.

Page 6: Suche ein effizientes Mittel zur Datenintegration

Was verstehen wir heute unter Suche und wo geht die Reise hin ?

Wo und wie kann Suchtechnology die integrierte Sicht auf Daten verbessern ? Wie kann man das mit Open Source Software umsetzen ?

Roadmap

Page 7: Suche ein effizientes Mittel zur Datenintegration

Suche – State of the Art and beyond

Page 8: Suche ein effizientes Mittel zur Datenintegration

Andrei Broder, Distinguished Scientist @Google, World Wide Web Conference, May 2015

Page 9: Suche ein effizientes Mittel zur Datenintegration

Basic Information Retrieval

Page 10: Suche ein effizientes Mittel zur Datenintegration

Basic Information Retrieval

• Fulltext Search• Boolean Operators• Field Types / Processing• Weighting, Scoring

Add-ons: • Synonyms / Controlled Vocabularies• Spellchecking• Complex Functions (grouping, joining)• Boosting• Facetting• Filtering

Page 11: Suche ein effizientes Mittel zur Datenintegration

Question Answering andInformation Supply Retrieval

Page 12: Suche ein effizientes Mittel zur Datenintegration

Question Answering andInformation Supply Retrieval

Page 13: Suche ein effizientes Mittel zur Datenintegration

Question Answering andInformation Supply Retrieval

Page 14: Suche ein effizientes Mittel zur Datenintegration

Question Answering andInformation Supply Retrieval

• Curated Information Resources (Knowledge Graph)• Information / Data Aggregation• Question Patterns / Natural Language Processing• Answering Patterns / Information Templates• Speech to Text Components• Multilinguality• Personalisation

Page 15: Suche ein effizientes Mittel zur Datenintegration

Assistance

Page 16: Suche ein effizientes Mittel zur Datenintegration

Goal Completion

New appointment in Calendar

Book a FlightBook a Hotel

Set Alarm Clock

Call a Taxi

Book a Table for LunchAlert delays

Buy a present

Page 17: Suche ein effizientes Mittel zur Datenintegration

Eine integrierte Sicht auf Daten und Informationen

Page 18: Suche ein effizientes Mittel zur Datenintegration

Mike leitet einen Copy Shop mit 5 festen Mitarbeitern und 10 studentischen Aushilfen. Er benutzt ein CRM System zur Kunden- verwaltung, Email zur Kommunikation, ein Erfassungs- und Abrechnungssystem für seine Aufträge und ein Filesharing System zur Datenverwaltung.

Beispiel 1: Mike's Copy Shop

Page 19: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1: Mike's Copy Shop

John Doe erkundigt sich nach einem Auftrag.

Page 20: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1: Mike's Copy Shop

Jane verschafft sich eine Kunden-Überblick.

Page 21: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1: Mike's Copy Shop

Ziel: integrierte Suche durch Datenverknüpfung

• Sammeln der Daten (inkl. Zugriffsrechte)

• Integration der verschiedenen Daten durch Verlinkung (z.B. über Entitäten) mittel genormter Schemen

• Aggregation gleicher Daten aus verschiedenen Applikationen (Matching)

• Evtl. Metadaten erheben (z.B. pagerank)

• Zentraler, effizienter Zugriff durch Indizierung

02/36

Page 22: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1I: Smart Customer Support

Die Deutsche Bahn betreibt mit dem "Reisebuddy" einen Concierge Service rund um das Thema Reise. Anfragen werden vom Kunden per SMS/Messenger gestellt und von Servicemitarbeitern bearbeitet. Diese nutzen für die benötigten Informationen interne und externe Quellsysteme.

02/36

Page 23: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1I: Smart Customer Support

02/36

Page 24: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1I: Smart Customer Support

02/36

Page 25: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1I: Smart Customer Support

02/36

Page 26: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1I: Smart Customer Support

Ziel: integrierte Suche durch Klassifizierung und Verteilung auf eine Menge von Endpunkten

• Klassifizieren der Anfrage (z.B. Reiseanfrage)

• Extraktion such-relevanter Entitäten (Information Units)

• Aufbau der Anfrage

• Evtl. Aggregation und Gewichtung

• Generieren der Antwort

Page 27: Suche ein effizientes Mittel zur Datenintegration

Lösungen mit Open Source Software

Page 28: Suche ein effizientes Mittel zur Datenintegration

Semantic Content Management 01/02

The Redlink Basic Components

Semantic Content Management 15/36

Page 29: Suche ein effizientes Mittel zur Datenintegration

• Qualität der Software steigt

• Qualität der Dokumentation steigt

• Manpower kann drastisch steigen

• Offene Libraries steigern Qualität und senken Entwicklungskosten

• Produkt wird besser wahrgenommen

• Marketing Kosten können sinken

• Geringeren Einfluss auf Roadmap und Entwicklungsziele

• keine SLAs bei Fremdsoftware

• Verlust von Kontrolle und Einzigartigkeit

• Keine Garantie (die Community bestimmt)

• Overhead (Community Building, Licensing, usw.)

• evtl. Einschränkungen durch Lizenzrechte

Warum Open Source ?

Pros Cons

Page 30: Suche ein effizientes Mittel zur Datenintegration

Semantic Content Management 16/36

• Read-Write Linked Data

• Triple Store mit Versionierung und Reasoning

• SPARQL und LDPath Anfragesupport

• Transparentes Linked Data Caching

The Open Platform for Linked Data

http://marmotta.apache.org/

Page 31: Suche ein effizientes Mittel zur Datenintegration

17/36

• Framework für Semantic Enhancement

• Natural Language Processing und Entity Recognition

• Mehrsprachigkeit

• Klassifikation und Sentiment Analyse

http://stanbol.apache.org

The Toolbox for Semantic Lifting

Page 32: Suche ein effizientes Mittel zur Datenintegration

Semantic Content Management 18/36

• Apache Lucene basiertes Suchframework

• Mehrsprachigkeit

• Hoch skalierbar (Solr cloud) und ultra schnell

• Hoch konfigurierbar

http://lucene.apache.org/solr/

The highgly scalable Search Server

Page 33: Suche ein effizientes Mittel zur Datenintegration

Semantic Content Management 18/36

Andere Komponenten

Apache TinkerPop™

...

Page 34: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1: Mike's Copy Shop

Page 35: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1: Mike's Copy Shop

Page 36: Suche ein effizientes Mittel zur Datenintegration

Beispiel 1I: Smart Customer Support

Enitity Extraction

Classification

Query Specific Models• Attribute• Vokabulare• Negation• Contextual Entities

Page 37: Suche ein effizientes Mittel zur Datenintegration

Take aways

Suche bietet heute mehr als klassisches Information Retrieval.

Suche ist ein gutes Mittel um eine integrierte Sicht auf Daten zu erhalten.

Natürlichsprachliche Eingabe ist State of the Art.

Open Source Software kann viele notwendige Schritte sehr gut abdecken.

Page 38: Suche ein effizientes Mittel zur Datenintegration

are you

ready to make sense

of your data?

[email protected]

Vielen Dank für die Aufmerksamkeit !