Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Prof. Dr. Andreas Hilbert [email protected]http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon +49 351 463-32359 Telefax +49 351 463-32736 Rico Ludwig Chris Reiche Patrick Schwabe Ausgewählte Aspekte der BI: Projektseminar Endpräsentation Mat. Nr.: 3111685 Mat. Nr.: 3206958 Mat. Nr.: 3235860
91
Embed
Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling
Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling Kampagnen-Management Fazit Literatur. Die Linusbank Allgemeine Marktübersicht. Höhere Preissensitivität Häufig 2 bis 4 Bankverbindungen Entwicklung kostenloser Girokonten : 2000: gesamt: 6 % - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 6
ProblembeschreibungWas der Kunde sagt
„Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangen hoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kunden adressieren. Leider können wir den Erfolg von Kampagnen nur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.“
„Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangen hoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kunden adressieren. Leider können wir den Erfolg von Kampagnen nur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.“
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 7
ProblembeschreibungWas der Kunde will
• Kosten für Kampagnen sehr hoch
• Kunden nutzen wenige Produkte
• Keine Erfolgsmessung der Kampagnen
• Wertvolle Kunden unbekannt
• Ziele:– Kundenzufriedenheit und Bindung erhöhen
– Wertvolle Kunden identifizieren
– Kosten reduzieren
– Erfolgsmessung für Marketingkampagnen einführen
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research
Endpräsentation
Die LinusbankProblembeschreibungProjektplan
ProjektablaufKoordination der Projektarbeit
Data UnderstandingData PreparationModelingKampagnenauswertung…
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 9
ProjektplanProjektablauf
• Orientierung des Projektablaufes an den Phasen des CRISP-DM
• Einarbeitung in Bankgeschäft und Daten der Linusbank
• Festlegen der Teilziele für Projektablauf
• Erarbeiten von Kennzahlen auf Basis der vorhandenen Daten
• Evaluation der erstellten Modelle und ableiten von Handlungsempfehlungen
sas
Projektgrafik anpassen
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 10
ProjektplanKooperation der Projektarbeit
• http://altranprojektseminar.wikispaces.com
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research
Endpräsentation
…ProjektplanData Understanding
Übersicht über vorhandene DatenProduktverteilungProdukterträgeKundenanalyseKundenwertkonzept
Data Preparation…
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 12
Deskriptive AnalyseÜbersicht über vorhandene Daten
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 13
Deskriptive AnalyseProduktverteilung (Gesamt)
• Girokonto hat größten Produktanteil
• Kredit nur vergleichsweise geringer Anteil
• Anteil für Riester und Sparen minimal
sas
sparkarte u kreditkarte raus !!!!!!1111eineinseinself
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 14
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 37
Teil der Aufgabenstellung:
Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester.
Ziel der AnalyseEindruck darüber gewinnen, welche Produkte häufig gemeinsam genutzt werden.
ModelingAssoziationsanalyse
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 38
Assoziationsanalyse Vorbereitung der Daten für Assoziationsanalyse
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 39
AssoziationsanalyseEinstellungen
• Der Datenfluss im Diagramm:
• Reduzieren der Werte, da Transaktionen wie Kredit oder Riester im verhältnis zur Gesamtzahl der Transaktionen relativ selten auftreten. Sie sollen aber trotzdem in der Analyse erscheinen
• Die Filtereinstellungen, um nicht zu berücksichtigende Produkte auszuschließen:
sas
bild schön machen :)
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 40
Assoziationsanalyse Ergebnis 1/2
• Das Ergebnis der Analyse mit dem ermittelten Warenkorb.
• Hier zu sehen sind nur die Regeln, die auf der rechten Seite genau ein Ergebnis erzeugen.
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 41
Assoziationsanalyse Ergebnis 2/2
• Überblick über alle erzeugten Regeln:
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 42
Assoziationsanalyse Fazit
• Häufig zusammen gekauft werden Zins, Depot und Riester in allen möglichen Kombinationen.
• Macht Sinn, da alle drei Produkte im Kern Sparprodukte darstellen.
• Starken Lift erzeugen Riester-Produkte, die sowohl für Zins, als auch Zins Kombination mit Giro oder Depot häufig nachgefragt werden.
• Diese Produkte werden jedoch vergleichsweise selten verkauft.
Handlungsmöglichkeiten:
Kunden, die bereits ein oder mehrere Produkte besitzen, könnten
entsprechend interessiert sein an den ermittelten Kombinationen. So
bietet es sich an, Besitzer von Zins, die noch über kein Depot verfügen,
ein Produktangebot vorzubereiten bzw. Depot-Besitzern auch
Linuszins anzubieten.
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 44
Modeling Clusteranalyse
Teil der Aufgabenstellung:Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester.
Ziel der AnalyseEindruck über die Kundenstruktur gewinnen. Gibt es typische Nutzergruppen, die ähnliche Eigenschaften aufweisen?
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 45
ClusteranalyseVorbereitung der Daten für Clusteranalyse
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 46
ClusteranalyseVorgehen
• Nachdem der Clusternode keine zufriedenstellenden Ergebnisse hervorbrachte, kam der SOM/Kohonen-Node zum Einsatz.
• Vorgehen:
• Sampling-Node mit Simple-Random (12345) als Starteinstellung und 4x6 Clustern.
• Anschließend Beobachtung des Distance-Plots auf eine gleichmäßige Verteilung der Cluster und Prüfung der Clusterhäufigkeit in den Statistics.
• Schrittweise Reduzierung der Clusterzahl brachte bei 2x3 Clustern das erste gute Ergebnis, bei dem die Cluster gut verteilt waren und keine Häufung mehr auftrat.
• Als wichtige Variablen zeigt sich stets die Beziehungsdauer, die Vermögensausprägung, Giro, Depot, Zins, Kredit.
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 47
ClusteranalyseErgebnis 1/5
• Ergebnis der Clusteranalyse
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 48
ClusteranalyseErgebnis 2/5
• Das Ergebnis der Analyse mit dem ermittelten Distanzgraphen.
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 49
ClusteranalyseErgebnis 3/5
• Das Alter wurde nicht in die Cluster-Unterscheidung einbezogen.
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 50
ClusteranalyseErgebnis 4/5
• Die Verteilung der Produkte auf die verschiedenen Cluster
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 51
ClusteranalyseErgebnis 5/5
• Während Vermögensausprägung durchaus einen Einfluss hat, ist die Kreditwürdigkeit in allen Clustern gleich verteilt.
sas
Rand wegschneiden
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 52
ClusteranalyseFazit
Es zeigen sich drei auffällige Cluster-Gruppierungen:
• So gibt es stets ein Cluster Kreditkunden, das einen erheblichen Anteil an Kreditkunden beinhaltet, die eine stark negative Vermögensausprägung aufweisen und eine mittlere Beziehungsdauer ab 3 Jahren erreichen.
• Die zweite Gruppe sind die Sparkunden mit positiver Vermögensausprägung, langer Bindungsdauer teils über 10 Jahre und allen drei Spar-Produkten Zins, Depot und Giro.
• Die dritte Gruppe umfasst die verbleibenden Cluster mit vorrangig ausgeglichenem Vermögen und häufig einem Girokonto oder Depot.
Handlungsmöglichkeiten:Es lässt sich erkennen, dass im Cluster der Sparkunden die klassischen Sparprodukte häufig nachgefragt werden. Ein Ansatz wäre, Kunden zu finden, die ebenfalls vermögend sind, aber noch nicht alle Produkte besitzen. Zusätzlich ist eine Aktion denkbar, bei der Kunden, die alle Produkte besitzen, aber nur geringe Einlagen aufweisen, zusätzliches Geld überweisen, weil sie mit hoher Wahrscheinlichkeit noch woanders über Konten mit
Spareinlagen verfügen.
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 54
Modeling Prognosemodelle
Teil der Aufgabenstellung:Entwickeln Sie jeweils ein produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte linuskredit, linusdepot, linusgiro, linuszins und linusriester.
Ziel der ModelleKlassifikation von Kunden, um Wahrscheinlichkeiten für Produktabschlüssen zu prognostizieren.
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 55
Modeling Vorbereitung der Daten für die Prognosemodelle
• Benötigte Datensätze:– Kundendaten_200806
– Kundendaten_200812
• Transformationen:– Alter (nominal 5 Klassen)
– Vermögensausprägung (ordinal -1 0 und 1)
– Produktnutzung (binär für jedes Produkt)
– Beziehungsdauer (nominal 5 Klassen)
• Kundenwert (Initialwert):– Klasse (nominal A bis E)
– Umsatz (metrisch)
• Ausgangsdaten:– Kundennummer (id)
– Alter (nominal 5 Klassen)
– Kanal (binär)
– Kreditwürdigkeit (nominal 3 Klassen)
– Vermögensausprägung (ordinal -1 0 und 1)
– Giro (binär)
– Kredit (binär)
– Riester (binär)
– Zins (binär)
– Depot (binär)
– Beziehungsdauer (nominal 5 Klassen)
– Klasse (nominal 5 Klassen)
– Umsatz (interval 115-4365)
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 56
Erstellung von StandardprognosemodellenVorgehen 1/2
• Aufgrund der Daten in Kundendaten_200806 Modelle entwickeln, welche
Prognosen für Produktabschlüsse erstellen
• Prognosen werden mit den tatsächlichen Daten aus Kundendaten_200812
verglichen und anhand der Misclassification Rate und dem Fehler zweiter
Art bewertet
- FZA sollte möglichst klein sein, da er potentiellen Kunden angibt, die nicht
angesprochen werden
• Um ein möglichst optimales Prognosemodell zu erhalten werden zunächst drei
Standardmodelle erstellt und davon das geeignetste weiter optimiert
• Bevorzugt wird nach Möglichkeit der Entscheidungsbaum, da er viele positive
Eigenschaften wie Verständlichkeit und hohe Performance besitzt
• Ausschluss von Kundendaten, welche bereits durch Kampagnen angesprochen
wurden, um die Ergebnisse nicht zu verfälschen
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 57
Erstellung von StandardprognosemodellenVorgehen 2/2
• Anlegen zwei paralleler
Datenstränge für je Trainings- bzw.
Validierungsdaten aus
Kundendaten_200806 und Testdaten
aus Kundendaten_200812
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 58
Erstellung von StandardprognosemodellenEinstellungen 1/3
• "Umsatz" aus Datensatz ausschließen, da indirekt im Kundenwert
enthalten:
• Anlegen von fünf Pfaden (mit je zwei Datensträngen) für jedes Produkt
• Jeweiliges Produkt als Target definieren:
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 59
Erstellung von StandardprognosemodellenEinstellungen 2/3
• Künstliches Angleichen der Verteilung in den Target-Variablen, um neutralen Trainingsdatensatz zu erhalten
• Gleichverteilung der Daten für Target, sodass keine Ausprägung der Variable dominiert
sas
Gleichverteilung der Daten für Target, sodass keine Ausprägung der Variable dominiert
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 60
Erstellung von StandardprognosemodellenEinstellungen 3/3
• Datenstränge für Training, Validierung und Test aufteilen:
• Standardmodelle des Künstlichen Neuronalen Netzes, der Regresion und des Entscheidungsbaums erstellen:
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 61
Erstellung von StandardprognosemodellenVergleich
• Standardmodelle im Assesment-Node vergleichen• Besonders geeignetes Modell auswählen, welches weiter zu optimieren
ist
• Auswahl anhand von Missclassifcation für Test
• Erkärung:
- Test: Vergleich des Modells mit Dezember
- Validation: Zur Optimierung Trainingsmodelle
• Bevorzugte Auswahl für Entscheidungsbaum, sofern er nicht wesentlich
schlechter ist
sas
hässlich :-)
sas
Auswahl anhand von Missclassifcation für TestErkärung: Test: Vergleich des Modells mit DezemberValidation: Zur Optimierung TrainingsmodelleAuswahl für bevorzugt für Entscheidungsbaum, sofern er nicht wesentlich schlechter ist
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 62
Optimierungen EntscheidungsbaumEinstellungen
• Wichtigstes Bewertungskriterium ist die Missclassifiation Rate im Testdatensatz und der
prozentuale Fehler zweiter Art
• Wenn alle Standardmodelle auf ähnlichen Niveau sind wird der Entscheidungsbaum
versucht zu optimieren
• Wenn sich größere Abweichungen ergeben werden zusätzlich zum Entscheidungsbaum
auch andere Modelle optimiert
• Optimierung Entscheidungsbaum:
– Absenkung es Signifikanzlevels
im Chi-Quadrat-Test
– Absenkung der minimalen
Beobachtungen je Blattkonten
– Erhöhung der benötigten
Beobachtungen für jede Split-
Suche
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 63
Optimierungen Neuronales NetzEinstellungen
• Modelauswahl Kriterium auf Misclassification Rate ändern
• Versteckte Neuronen erhöhen, direkte Verbindungen zulassen
TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research
Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 64
Optimierungen RegressionEinstellungen
• Methode auf Backward ändern
• Validation Misclassification als Kriterium wählen
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research