Top Banner
Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard
24

Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

Apr 05, 2015

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

Self Organizing Tree Algorithm

Bastian JarzembinskiEnrico Bade

Tobias Aagard

Page 2: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

2

Gliederung

Theorie

Hintergrund

Lernverfahren

Experimente

Attributskalierung

Wachstumssteuerung

Bewertung

Vergleich mit anderen Verfahren

Einsatz

Page 3: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

3

Theorie Hintergrund Lernverfahren

Page 4: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

4

Theorie Hintergrund

Bioinformatik

Microarrays

Ähnliches Aussehen = Ähnliche Funktion?

Page 5: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

5

Theorie Lernverfahren

n-dimensionale Vektoren mit metrischen Attributen

Knoten bilden Clusterzentren

Knoten mit größter Varianz wird geteilt

Page 6: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

6

Theorie Lernverfahren

Inputvektor

Repräsentant

Distanz

Lernrate

Fehler

Page 7: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

7

Theorie Lernverfahren

Wurzel

Blatt

Zuordnung

Page 8: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

8

Theorie Lernverfahren

Ressource /mittlere Abweichung

Variability /Spannweite

Page 9: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

9

Theorie Lernverfahren

Page 10: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

10

Theorie Lernverfahren

?

Page 11: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

11

Theorie Lernverfahren

Ancestor / Vorfahre

Sister / Schwester

Page 12: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

12

Experimente Attributskalierung Fallbeispiel

Page 13: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

Experimente Attributskalierung

Parameter in KNIME können das zyklisches Wachsen des Treesbeeinflussen:

Lerningrates

min. variablity und min. ressource nur bei „Use variablity“ berücksichtigt

min. Error

Distance: Euclid. Oder Cosinus

Clustern ohne Zielattribut

Page 14: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

Experimente Fallbeispiel

IRIS-Datenset

4 Attribute, metrisch skaliert

Zielattribut mit 3 Klassen

LIVE DEMO

Quantitativer Vergleich zu Klassifikationsalgorithmen

i.d.F. k-Means

Keine signifikanten Unterschiede

Anwendung des SOTA auf Daten mit und ohne Zielattribut

Keine signifikanten Unterschiede

Page 15: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

15

Bewertung Vergleich mit anderen Verfahren Einsatz

Page 16: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

16

Bewertung Vergleich mit anderen Verfahren

Eigenschaften k-Means

Wenige Iterationen

Einfaches Verfahren

Anfällig für Rauschen / Ausreißer

Ergebnis von initialen Zerlegung abhängig

Page 17: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

17

Bewertung Vergleich mit anderen Verfahren

Eigenschaften k-Means

Wenige Iterationen

Einfaches Verfahren

Anfällig für Rauschen / Ausreißer

Ergebnis von initialen Zerlegung abhängig

Annähernd lineares Laufzeitverhalten

Punkt für k-Means

Resistent

Unabhängig

Eigenschaften SOTA

Page 18: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

18

Bewertung Vergleich mit anderen Verfahren

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

Page 19: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

19

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

Bewertung Vergleich mit anderen Verfahren

Divisives Verfahren

Knoten sind Mittelwerte sämtlicher folgenden Knoten

Zuordnung wird ständig angepasst

Eigenschaften SOTA

Page 20: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

20

Bewertung Vergleich mit anderen Verfahren

Self Organizing Map (Kohonen Map)

Ähnliches Verfahren, aber andere Topologie

SOM: vorgegebenes Netz, wird bestmöglich an den Eingaberaum angepasst

SOTA: wächst dynamisch, um den Eingaberaum bestmöglich darzustellen; Hierarchie vorhanden

Page 21: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

21

Bewertung Einsatz

Methodisch vielversprechend

Erfolge nicht reproduzierbar

Mögliche Ursachen

Ungeeignete Daten

Ungeeignete Parameterjustierung

Mangelndes (Aufgaben-)Verständnis

Weitere Untersuchung

Hintergrundwissen Bioinformatik

Microarray-Datensätze wählen

Page 22: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

22

Fin

Page 23: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

23

Theorie Hintergrund

Page 24: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard.

24

Theorie Hintergrund