Kollaboratives Strukturieren von Multimediadaten für Peer-to-Peer Netze Lehrstuhl für Künstliche Intelligenz Prof. Dr. Katharina Morik Dipl. inf. Michael Wurst C B Jazz Pop A C A Jazz
Kollaboratives Strukturieren von Multimediadaten für
Peer-to-Peer Netze
Lehrstuhl für Künstliche Intelligenz
Prof. Dr. Katharina Morik
Dipl. inf. Michael Wurst
C
B
Jazz Pop
A
C A
Jazz
Was heißt das?
● Kollaborativ● Strukturieren● Multimediadaten● Peer-to-Peer
Peer-to-Peer Computing
● Keine zentrale, vermittelnde Instanz● Kommunikation direkt zwischen einzelnen
Knoten● Agenten, P2P Filesharing , ...
A B
C D
Zentralisiertes Anbieten von Daten
A
B
C D
A
D
Verteiltes Anbieten von Daten
Was heißt das?
● Kollaborativ● Strukturieren● Multimediadaten● Peer-to-Peer
Strukturieren von Daten
● Objekte in Beziehung setzen(z.B. Ähnlichkeit)
● Objekte zu Kategorien zusammenfassen(z.B. Musikgenres)
● Taxonomien, als hierarchische Anordnung von Kategorien
● Ontologien, als Form von komplexen logischen Beziehungen zwischen Objekten(z.B. ist Autor von(X,Y))
AB
Zentralisiertes Strukturieren von Daten
CD
Pop RockMetal
A
B
CD
A
D
SoftRock
Metal
Jazz Pop
DeutschEnglisch
Verteiltes Strukturieren von Daten
Was heißt das?
● Kollaborativ● Strukturieren● Multimediadaten● Peer-to-Peer
A
B
CD
A
D
SoftRock
Metal
Jazz Pop
DeutschEnglisch
Kollaboratives Strukturieren von Daten
Pop
Kopieren von Teilbäumen
A
B A
D
SoftRock
Metal
Jazz
DeutschEnglisch
C
D
B A
Jazz Pop
A
B
CD
A
D
SoftRock
Metal
Jazz Pop
DeutschEnglisch
Kollaboratives Strukturieren von Daten
Klassifizieren von Objekten
A
B
CD
A
D
SoftRock
Metal
Jazz Pop
DeutschEnglisch
B
A
A
B
CD
A
D
SoftRock
Metal
Jazz Pop
DeutschEnglisch
B
???
Kollaboratives Strukturieren von Daten
Beschreibung von Objekten
A
B
CD
A
D
SoftRock
Metal
Jazz Pop
DeutschEnglisch
B
Jazz
Weitere mögliche Anwendungen
● Finden ähnlicher Objekte● Finden ähnlicher Kategorien● Finden eines passenden Schemas gegeben eine
Menge von Objekten (z.B. Internetradio)● Finden von Benutzern mit ähnlichen Interessen● ...
Was heißt das?
● Kollaborativ● Strukturieren● Multimediadaten● Peer-to-Peer
Verarbeitung von Multimediadaten
● Objekte (z.B. mp3 Dateien) müssen geeignetkodiert werden
● Problem: Welche Merkmale sollen ausgewählt werden? Wie beschreibt man Musik oder Video?
● Erste Möglichkeit: Externe Metadaten (z.B. festgelegtes Genre, Interpret, Schauspieler, Jahr)
● Zweite Möglichkeit: Extrahierte Metadaten (z.B. Tempo, Lautstärke, ...)
Anpassung des Entwurfes
Durchführung
Data Mining
Aufgaben
Data Mining
Aufgaben
Data Mining Experiment
Meta-
Daten
Daten
Entwurf
Das Yale System
Yale Features
– Operatoren zur Datenvorverarbeitung(Audiodaten, Texte, ...)
– Zahlreiche Lernverfahren (Klassifikation, Clustering, Merkmalstransformation, ...)
– Leicht erweiterbar (Java/XML basiert)
– GUI/Batchmodus, Anwendungs API
– Opensource / Weltweite Verbreitung (20+ Länder)
Audioverarbeitung mit YALE
xyz.mp3
0.1 0.4 0.2 ... 0.0 0.0 0.3
Tempo Lautstärke
Relevante Forschungsgebiete
● Multimediaverarbeitung/Retrieval● Metadatenannotierung (MPEG-7)● Maschinelles Lernen● Ontologien, Kataloge, Semantic Web● Verteilte Algorithmen/Agentensysteme/
Dezentrale Architekturen
Was heißt das?
● Kollaborativ● Strukturieren● Multimediadaten● Peer-to-Peer
PG Aufgabe
YALEAudioverarbeitung
Existierendes P2P/Agentensystem
B
CB
A
Soft
Jazz Jazz
PopA
Aufgaben I
● Auswahl eines geeigneten P2P Systems● Entwurf eines erweiterbaren Frameworks:
– Lokale Kodierung von Objekten (Yale)– Austauschprotokolle für Objektinformationen und
Ontologien– Indexierung für schnelle Suche– Verteiltes Maschinelles Lernen (Yale)– Evaluationsmöglichkeiten (Yale)– Einfaches Benutzerinterface
Aufgaben II
● Auswahl und Entwurf von Funktionen für das System
● Implementierung/Test des Frameworks● Implementierung/Test der einzelnen Funktionen● Evaluierung des Gesamtsystems● Dokumentation und Deliverables
(nicht nur Endbericht)
Geplanter Ablauf der PG
● Ab 3.9. Ausgabe von Seminarthemen● Anfang Oktober: Seminarphase● Analyse/Spezifikation: Aufteilung in Arbeitsgruppen● Entwicklungsphase I● Anfang SS05: Seminarphase II● Entwicklungsphase II● Integration und Evaluation● Zusammenfassung der Deliverables zum Endbericht
Projektgruppen am Lehrstuhl VIII
● Professionelles Softwareengineering und Projektmanagement
● Anspruchsvolle, forschungsrelevante Aufgaben (kein bloßes Implementieren)
● Möglichkeit für wissenschaftliche Veröffentlichungen
● Möglichkeit als HiWi beim LS VIII zu arbeiten
● Möglichkeit für Diplomarbeit beim LS VIII
● Kooperation mit anderen Gruppen
Projektgruppen am Lehrstuhl VIII
● Eigenständiges Arbeiten bei intensiver Betreuung● 5 erfolgreiche vergangene PGs● Weitere Infos:
Homepage LS VIIIoder direkt bei uns GB IV/R120
Literatur/Links
● Milojicic, M.J. et. al: Peer-to-peer computing.
● Maes P.:Agents that reduce work and information overload, Communications of the ACM, 1994.
● Mitchell, T: Machine Learning, McGraw Hill, 1997.
● Anderberg, M.: Cluster Analysis for applications, 1973.
● mpeg Überblick (besonders mpeg-7): www.chiariglione.org/mpeg
● YALE: http://yale.cs.uni-dortmund.de