Business Intelligence und Web Data Mining Prof. Dr. Wolfram Höpken eBusiness-Lotse Oberschwaben-Ulm @ Hochschule Ravensburg-Weingarten [email protected] Amadeus Technology Forum München/Erding 13.11.2013
Business Intelligence und Web Data Mining Prof. Dr. Wolfram Höpken eBusiness-Lotse Oberschwaben-Ulm @ Hochschule Ravensburg-Weingarten [email protected] Amadeus Technology Forum München/Erding 13.11.2013
2 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
3 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Agenda
Business Intelligence & Data Mining im Tourismus
Aktuelle BI-Trends
Technologische Herausforderungen
Nutzen und Potentiale im Tourismus
Zusammenfassung
4 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Agenda
Business Intelligence & Data Mining im Tourismus
Aktuelle BI-Trends
Technologische Herausforderungen
Nutzen und Potentiale im Tourismus
Zusammenfassung
5 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Einsatz von BI & Data Mining im Tourismus
Revenue Management • Erklärung des Buchungs- und
Cancellation-Verhaltens • Vorhersage der touristischen
Nachfrage • Vorhersage von Flugpreisen (DINAMO: Yield Management System entwickelt von American Airlines 1988)
Produktoptimierung & Vertrieb • Erklärung des Konsumverhaltens
von Touristen • Optimale Produktbündelung /
Warenkorbanalysen • Cross-Selling
Customer Relationship Management • Kundensegmentierung • Adaptives Marketing
6 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Beispiel – Erklärung des Cancellation-Verhaltens
Welche Eigenschaften des Kunden, seines Verhaltens, des gebuchten Produkts erklären das Cancellation-Verhalten?
“Klassifikation”
first year of arrival > 2009
bookings of customer > 1
skipass > 1
other products > 0
days to arrival > 42 days to arrival <= 42
first year of arrival <= 2009
bookings of customer <= 1
skipass <= 1
other products <= 0
ski equipment <= 2
Root node (65,455)
Booked: 91.63%, Cancelled: 8.37%
Node 1 (41,160)
Booked: 98.53%, Cancelled: 1.47% Node 2 (24,295)
Booked: 79.93%, Cancelled: 20.07%
Node 3 (21,719)
Booked: 77.96%, Cancelled: 22.04% Node 4 (2,576)
Booked: 96.54%, Cancelled: 3.46%
ski equipment > 2
Node 5 (20,344)
Booked: 76.76%, Cancelled: 23.24% Node 6 (1,375)
Booked: 95.71%, Cancelled: 4.29%
Node 7 (17,536)
Booked: 74.19%, Cancelled: 25.81% Node 8 (2,808)
Booked: 92.81%, Cancelled: 7.19%
Node 9 (4,987)
Booked: 86.86%, Cancelled: 13.14% Node 10 (12,549)
Booked: 69.16%, Cancelled: 30.84%
Node 11 (10,408)
Booked: 76.73%, Cancelled: 23.27% Node 12 (2,141)
Booked: 32.37%, Cancelled: 67.63%
7 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Aktuelle Situation
Das Potential Explosionsartige Zunahme verfügbarer Daten über nahezu
alle touristisch relevanten Abläufe und Aktivitäten
Transaktionsdaten (Buchungen, Aufenthalte, Konsum, etc.)
Navigationsverhalten auf Webseiten
Kundenfeedback und Produktbewertungen
Starke Zunahme von Rechenleistung und Speicherkapazität
Die Herausforderung Diese wertvollen Informationen bleiben oftmals ungenutzt
“we are drowning in information but starved for knowledge” (John Naisbitt)
8 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Agenda
Business Intelligence & Data Mining im Tourismus
Aktuelle BI-Trends
Technologische Herausforderungen
Nutzen und Potentiale im Tourismus
Zusammenfassung
9 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Traditionelle BI-Anwendungen
Merkmale traditioneller BI-Anwendungen Fokus: klassische Geschäfts-Transaktionen Klare Trennung von operativen und dispositiven Systemen Daten: Intern, strukturiert
Data Warehouse
Reporting
OLAP
Data Mining
CRS
ERP
CRM
Online-Plattformen
Operative Systeme (OLTP) Dispositive Systeme (OLAP)
10 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Trend 1: Operationales BI
Direkte Rückkopplung mit den operativen Systemen
Automatische Berücksichtigung der Analyse-Ergebnisse innerhalb der operativen Systeme • Dynamische Preisfindung, Yield Management • Intelligente Produktempfehlungen (Recommender-Systeme) • Personalisierung von Angeboten und Werbung (Targeting)
Data Warehouse
Reporting
OLAP
Data Mining
CRS
ERP
CRM
Online-Plattformen
Stärkerer Fokus auf analytischem BI • Prognosemodelle zur
Vorhersage der Nachfrage
• Clusteranalysen zur Kundensegmentierung
• Association Rules zur Produktempfehlung und Cross Selling
Operative Systeme (OLTP) Dispositive Systeme (OLAP)
11 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Trend 1: Operationales BI
Direkte Rückkopplung mit den operativen Systemen
Data Warehouse
Reporting
OLAP
Data Mining
CRS
ERP
CRM
Online-Plattformen
Rückfluss der Erkenntnisse in Echtzeit (Realtime BI) • Dynamische Preisfindung aufgrund aktueller
Nachfrageschwankungen • Produktempfehlungen aufgrund aktuellem Kundenfeedback
(Auslastung/Wartezeit, Attraktivität, etc.)
Operative Systeme (OLTP) Dispositive Systeme (OLAP)
12 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Trend 2: Integration allumfassender Informationen
Data Warehouse
Reporting
OLAP
Data Mining
CRS
ERP
CRM
Online-Plattformen
Web Content
• User Generated Content (Kundenfeedback/Meinungen) • Marktdaten und Daten über Konkurrenten (z.B. Veränderungen der
Angebotsstruktur, Preisentwicklungen)
Operative Systeme (OLTP) Dispositive Systeme (OLAP)
Externe Datenquellen
13 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Trend 2: Integration allumfassender Informationen
Data Warehouse
Reporting
OLAP
Data Mining
CRS
ERP
CRM
Online-Plattformen
Web Content
• Ökonomische Daten (z.B. BIP, Beschäftigungsdaten in Sendeländern)
• Wetterdaten (historische Wetterdaten und Wettervorhersagen)
Umweltdaten
Operative Systeme (OLTP) Dispositive Systeme (OLAP)
Externe Datenquellen
14 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Trend 2: Integration allumfassender Informationen
Data Warehouse
Reporting
OLAP
Data Mining
CRS
ERP
CRM
Online-Plattformen
Web Content
• Interaktion mit der lokalen Infrastruktur (Licht, Klimaanlage, Minibar, Musikanalage, TV, Telefon, etc. z.B. im Hotelzimmer)
Umweltdaten Lokale Infrastruktur
Operative Systeme (OLTP) Dispositive Systeme (OLAP)
Externe Datenquellen Interaktion mit der Umwelt
15 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Trend 2: Integration allumfassender Informationen
Data Warehouse
Reporting
OLAP
Data Mining
CRS
ERP
CRM
Online-Plattformen
Web Content
• Location Tracking (GPS-basiert) • Aufenthalt an POIs (QR-Code/RFID/NFC-basiert)
Umweltdaten Lokale Infrastruktur
Bewegungs-profile
Operative Systeme (OLTP) Dispositive Systeme (OLAP)
Externe Datenquellen Interaktion mit der Umwelt
16 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Trend 2: Integration allumfassender Informationen
Data Warehouse
Operative Systeme (OLTP)
Reporting
OLAP
Data Mining
Dispositive Systeme (OLAP)
CRS
ERP
CRM
Online-Plattformen
Externe Datenquellen
Web Content Umweltdaten Lokale Infrastruktur
Interaktion mit der Umwelt
Bewegungs-profile
Typische Eigenschaften dieser Daten • Oftmals unstrukturiert (Web Content) • Sehr große Datenmengen • Extern
17 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Agenda
Business Intelligence & Data Mining im Tourismus
Aktuelle BI-Trends
Technologische Herausforderungen
Nutzen und Potentiale im Tourismus
Zusammenfassung
18 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Technologische Herausforderungen
Informationsextraktion aus unstrukturierten Daten
Informationsintegration heterogener Daten
Große Datenmengen Realtime-BI
19 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Informationsextraktion aus unstrukturierten Daten
Wrapper-basierte Extraktion aus Webseiten Wrapper Induction
(semi)automatische Extraktion relevanter Informationen auf Basis wiederkehrender Strukturen
20 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Informationsextraktion aus unstrukturierten Daten
Opinion Mining / Sentiment Analysis Topikalität: Zuordnung eines Satzes zu einem Themengebiet
(Servicequalität, Zimmer, Verpflegung, usw.) Tonalität: Ermittlung der Stimmung eines Satzes (negativ, neutral,
positiv) Verwendete Verfahren
Wortlistenbasierte Verfahren Maschinelles Lernen (Text-Klassifikation,
Named Entity Recognition)
Erkennung der
Topikalität (wortlistenbasiert)
Erkennung der Tonalität
(Maschinelles Lernen: SVM mit Bi-grams)
21 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Technologische Herausforderungen
Informationsextraktion aus unstrukturierten Daten
Informationsintegration heterogener Daten
Große Datenmengen Realtime-BI
22 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Große Datenmengen und Realtime-BI
In-Memory Datenbanken (SAP HANA, Oracle TimesTen) Bereitstellung des gesamten Data Warehouses im
Hauptspeicher
Unterstützt spaltenorientierte Datenspeicherung
Rapide Beschleunigung von Auswertungen (OLAP)
SAP bietet HANA Cloud Plattform
23 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Große Datenmengen und Realtime-BI
Cluster-Lösungen mit der Map&Reduce Methode Parallelisierung der Verarbeitung in Server-Clustern (Hadoop)
Für komplexe ETL-Prozesse und Data Mining Analysen
Data Warehouse
Operative Systeme (OLTP)
Reporting
OLAP
Data Mining
Dispositive Systeme (OLAP)
CRS
ERP
CRM
Online-Plattformen
Externe Datenquellen
Web Content Umweltdaten
Lokale Infrastruktur
Interaktion mit der Umwelt
Bewegungs-profile
Hadoop Cluster
24 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Agenda
Business Intelligence & Data Mining im Tourismus
Aktuelle BI-Trends
Technologische Herausforderungen
Nutzen und Potentiale im Tourismus
Zusammenfassung
25 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Das Potential für den Tourismus
Extraktion des gesamten Wissens aus ALLEN erdenklichen Datenquellen • Buchungsverhalten, Kaufverhalten, etc. • Kundenprofile aus Kundendatenbanken • Surfverhalten, Informationsbedarf auf Web-Plattformen • Nutzungs- u. Bewegungsprofile über mobile Dienste • Kundenfeedback aus User Generated Content • Marktdaten / Angebotsstruktur der Konkurrenz • Ökonomische Daten, Umgebungsdaten (z.B. Wetterdaten)
Decision Support • Revenue Management • Optimierung des
Realprodukts
Operative Abläufe • CRM • Marketing & Vertrieb
26 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Revenue Management
Vorhersage der Nachfrage oder Cancellations / No-shows auf Basis neuer Datenquellen
Wetterdaten, Konsumdaten, Location-tracking, UGC, Website-Traffic, etc.
Vorhersage der Nachfrage auf Basis des Website-Traffics
27 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Revenue Management
Vorhersage der Nachfrage auf Basis des Google-Suchvolumens
28 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Revenue Management
Preisgestaltung auf Basis der Kundenzufriedenheit (in der Hotellerie)
Bei gesunkener Zufriedenheit wird versucht, die Service-Qualität zu erhöhen, um höheren Preis zu rechtfertigen
Bei hoher Preis-Leistungszufriedenheit (>80%) wird Preis erhöht
29 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Revenue Management
Preisgestaltung auf Basis von Marktbeobachtungen
Analyse von Hotelpreisveränderungen (SEMAMO)
30 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Optimierung des Realprodukts
Verbesserung der Produkt-/Dienstleistungsqualität auf Basis der automatisierten Auswertung von Kundenfeedback (Sentiment Analysis)
Extraction des Kundenfeedbacks von Review-Plattformen (Are)
31 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Optimierung des Realprodukts
Verbesserung der Produkt-/Dienstleistungsqualität auf Basis der automatisierten Auswertung von Kundenfeedback (Sentiment Analysis)
Detaillierte Betrachtung des Kundenfeedbacks (positive/negative Statements)
32 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Optimierung des Realprodukts
Verbesserung der Produkt-/Dienstleistungsqualität auf Basis der automatisierten Auswertung von Kundenfeedback (Sentiment Analysis)
Benchmarking entlang der Produktbereiche
33 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Marketing & Vertrieb
Intelligente Produktempfehlungen (Recommendation) Content-based Filtering
Empfehlung von Produkten, die dem Kunden in der Vergangenheit gefallen haben (auf Basis seiner Bewertungen und seines Feedbacks in sozialen Medien)
Collaborative Filtering Empfehlung von Produkten, die ähnlichen Kunden gefallen
haben Ähnliche Kunden = Kunden mit ähnlichen Präferenzen, mit
ähnlichen Eigenschaften oder Verhalten, Freunde in sozialen Netzwerken
Beispiele Extreme Search oder Featured Results von Amadeus Know Me von British Airways
34 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Beispiel - Intelligente Produktempfehlungen
35 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Marketing & Vertrieb
Vorhersage von Flugverspätungen
Historische
Flugdaten
Historische
Wetterdaten
Vorhersage
(Knoblock 2004)
Learned Flight Delay Predictor Learned Flight Delay Predictor Vorhersagemodell
Flugverspätungen
36 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Marketing & Vertrieb
Vorhersage von Flugpreisen Vorhersagemodell zur Entscheidung, ob gekauft oder noch
gewartet werden sollte (Hamlet: to buy or not to buy - 24% Ersparnis pro Passagier; 62% der max. möglichen Ersparnis)
250
750
1250
1750
2250
12/8/2002 12/13/2002 12/18/2002 12/23/2002 12/28/2002 1/2/2003 1/7/2003Date
Pri
ce
(Knoblock 2004)
37 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Fallbeispiel Tourismusdestination
Kundenbasierte Wissensverwendung • Recommender-Systeme • Location-based-Services • Community-Services
Anbieterbasierte Wissensverwendung • Business Intelligence
Applikationen (DMIS)
Kundenbasierte Wissensgenerierung • Informationsbedarf • Nutzungsverhalten im Web • Buchungs-
/Konsumverhalten • Bewegungsmuster • Feedback,
Produktbewertungen
Anbieterbasierte Wissensgenerierung • Produkte/Kapazitäten • Marktteilnehmer • Marktinformationen
Wissens-generierung
Wissens-verwendung
38 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Fallbeispiel Tourismusdestination
39 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Fallbeispiel Smart Hotel Room
Mobiler Guide Kunde • Basisfunktionalität (Steuerung von
Anlagen/Geräten, Informations- & Reservierungsfunktionen) liefert Informationen über Kundenwünsche/-verhalten (z.B. gewünschte Temperatur, Licht, Musik/TV-Programm, Info-Bedarf, Konsumverhalten)
Mobiler Guide Mitarbeiter • Erfasst Kundenbedürfnisse/-verhalten
(z.B. Tisch/Speisenwahl im Restaurant)
Elektronische Steuerungen • Liefert Informationen über manuelle
Nutzerinteraktionen (Klimaanlage, Licht, Radio/TV)
Sensoren • Liefert Informationen über
Nutzerverhalten (z.B. Bewegungsmuster, Minibarentnahme)
Mobiler Guide Kunde • Liefert personalisierte Informationen
Pull/Push (z.B. Empfehlung von Speisen, Aktivitäten, Radio/TV-Progr.)
Mobiler Guide Mitarbeiter • Zugriff auf Kundenprofile – Pull (Abfrage
bevorzugter Tisch/Speisen, Aktivitäten) • Empfehlungen für Kundeninteraktion –
Push (z.B. Erinnerung an geplante Aktivitäten, passende Angebote)
Elektronische Steuerungen • Automatische Steuerung von
Anlagen/Geräten auf Basis des Nutzerprofiles (Klimaanlage, Licht, Radio/TV)
Anpassung / Personalisierung der Umgebung
Generierung von Nutzerprofile
Nutzerprofile
40 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Agenda
Business Intelligence & Data Mining im Tourismus
Aktuelle BI-Trends
Technologische Herausforderungen
Nutzen und Potentiale im Tourismus
Zusammenfassung
41 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Zusammenfassung
Aktuelle Trends Der Tourist hinterlässt Spuren bei nahezu allen touristisch
relevanten Aktivitäten Buchungs-/Konsumverhalten, Informationsbedarf, Vorlieben und
Präferenzen, Bewegungsmuster, Feedback, usw. Es ist heutzutage technisch möglich, alle diese Informationen
zu beschaffen und auszuwerten Web Data Mining (Text Mining, Sentiment Analysis, etc.)
Verbesserung des Decision Support Erweiterung eines Data Warehouses um neue
Geschäftsprozesse und Datenquellen Steuerung operativer Abläufe und Personalisierung der Kundeninteraktion Operatives BI
42 Prof. Dr. Wolfram Höpken Business Intelligence und Web Data Mining
Herausforderungen & Empfehlungen
Analysieren Sie das Potential für Ihr Unternehmen Wo können neuartige Informationsquellen Ihre
Entscheidungsprozesse unterstützen? Welche Kundenprozesse können durch neuartige
Informationsquellen optimiert und personalisiert werden? Wo kann ein konkreter Kundennutzen generiert werden?
Erproben Sie die Realisierbarkeit
Liefern die Daten das gewünschte Wissen und lässt sich der geplante (Kunden)Nutzen realisieren?
Technisch neuartige/komplexe IT-Lösungen können zunächst als add-on zu Ihrer bestehenden IT-Landschaft realisiert werden
Bauen Sie Know-how auf