This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
3 representaciones alternativas del mismo árbol3 representaciones alternativas del mismo árbol[no ordenado][no ordenado]
Codificación del árbolCodificación del árbol�� DFS [DFS [DepthDepth--firstfirst]: ]: A C B A C B ↑↑ AA ↑↑ ↑↑ BB�� BFS [BFS [BreadthBreadth--firstfirst]:]: A $ C B $ B AA $ C B $ B A�� DepthDepth sequencesequence:: ((0,A) (1,C) (2,B) (2,A) (1,B0,A) (1,C) (2,B) (2,A) (1,B)) 33
�� Generación de candidatosGeneración de candidatos
�� Conteo del soporteConteo del soporte
99
POTMinerPOTMiner
Generación de candidatosGeneración de candidatos
““RightmostRightmost expansionexpansion””
1010
POTMinerPOTMiner
Generación de candidatosGeneración de candidatos
Diferentes estrategiasDiferentes estrategias�� ““RightmostRightmost expansionexpansion” (” (FreqTFreqT))
�� TMG [TMG [TreeTree--ModelModel--GuidedGuided] ] candidatecandidate enumerationenumeration�� … con secuencias de profundidad… con secuencias de profundidad�� … con secuencias de profundidad… con secuencias de profundidad
((UnotUnot, , uFreqtuFreqt, , GastonGaston, TRIPS), TRIPS)�� Extensión basada en clases de equivalenciaExtensión basada en clases de equivalencia
((TreeMinerTreeMiner, SLEUTH, , SLEUTH, POTMinerPOTMiner, RETRO, , RETRO, PhylominerPhylominer))�� ““RightRight--andand--leftleft” ” treetree joinjoin (AMIOT)(AMIOT)�� ““ExtensionExtension and and joinjoin” (” (HybridTreeMinerHybridTreeMiner))
1111
POTMinerPOTMiner
Clases de equivalenciaClases de equivalencia
Clase de equivalencia Clase de equivalencia con dos elementos, ACA y ACcon dos elementos, ACA y AC↑↑BBqque comparten el prefijo ACue comparten el prefijo AC
1212
POTMinerPOTMiner
Generación de candidatosGeneración de candidatos
Clases de equivalenciaClases de equivalencia
IDEAIDEAGenerar todos los patronesGenerar todos los patronesposibles, pero sin generarposibles, pero sin generarpatrones por duplicado…patrones por duplicado…
�� Listas de ocurrencias Listas de ocurrencias ((tidtid, i, i11, i, i22… … iikk))
�� Listas de ámbitosListas de ámbitos ((tidtid, m, s), m, s)1717
POTMinerPOTMiner
Cálculo del soporteCálculo del soporte
Reunión de listas de ámbitosReunión de listas de ámbitosIn-scope join(child extension)
1818
Out-scope join(cousin extension)
POTMinerPOTMiner
EjemploEjemplo
Conjunto de datosConjunto de datos
1919
POTMinerPOTMiner
EjemploEjemplo
Patrones de tamaño 1Patrones de tamaño 1(“representación vertical”)(“representación vertical”)
2020
POTMinerPOTMiner
EjemploEjemplo
Clases de equivalenciaClases de equivalenciaderivadas de lo patrones derivadas de lo patrones de tamaño 1de tamaño 1
2121
POTMinerPOTMiner
EjemploEjemplo
Clases de equivalenciaClases de equivalenciaderivadas de lo patrones derivadas de lo patrones de tamaño 2de tamaño 2
2222
POTMinerPOTMiner
Algoritmo basado en clases de equivalencia Algoritmo basado en clases de equivalencia (como SPADE para secuencias, (como SPADE para secuencias, TreeMinerTreeMiner//SleuthSleuth para árboles)para árboles)
2323
POTMinerPOTMiner
Implementación paralelaImplementación paralela
Distribución de candidatos [CD: Distribución de candidatos [CD: CandidateCandidate DistributionDistribution]]
2424
POTMinerPOTMiner
Implementación paralelaImplementación paralela
2525
POTMinerPOTMiner
POTMinerPOTMiner “light”“light”
(generación de listas de ámbitos bajo demanda)(generación de listas de ámbitos bajo demanda)
Bases de datos Bases de datos multirelacionalesmultirelacionales
Dos tipos de patronesDos tipos de patrones�� E E = = EmbeddedEmbedded subtreessubtrees�� I I = = InducedInduced subtreessubtrees�� I I = = InducedInduced subtreessubtrees
Dos esquemas de representaciónDos esquemas de representación�� K K = “Key= “Key--basedbased treetree representationrepresentation””�� O O = “= “ObjectObject--basedbased treetree representationrepresentation””
4141
AgradecimientosAgradecimientos
Aída Jiménez, Aída Jiménez, Ph.D.Ph.D.
Tesis doctoralTesis doctoralTesis doctoralTesis doctoralKnowledge discovery in nonKnowledge discovery in non--linear linear structuresstructures
DepartamentoDepartamento de de CienciasCiencias de la de la ComputaciónComputación e I.A.e I.A.MarzoMarzo de 2011de 2011
4242
“If you torture the data long enough, it will confess” -- Ronald Coase
�� PangPang--NingNing Tan, Tan, Michael Michael SteinbachSteinbach& & VipinVipin KumarKumar::IntroductionIntroduction toto Data Data MiningMiningAddisonAddison--WesleyWesley, 2006. , 2006.
BibliografíaBibliografía
AddisonAddison--WesleyWesley, 2006. , 2006. ISBN 0321321367 ISBN 0321321367 [capítulos 6&7][capítulos 6&7]
�� JiaweiJiawei Han Han & & MichelineMicheline KamberKamber: : Data Data MiningMining: : ConceptsConcepts and and TechniquesTechniquesMorgan Morgan KaufmannKaufmann, 2006., 2006.ISBN 1558609016 ISBN 1558609016 [capítulo 5][capítulo 5] 4444
�� Aída JiménezAída Jiménez, , Fernando Berzal & Juan Carlos Cubero: Fernando Berzal & Juan Carlos Cubero: Frequent Frequent tree pattern mining: A tree pattern mining: A survey, survey, IntelligentIntelligent Data Data AnalysisAnalysis 14(6):60314(6):603--622622, 2010. , 2010. DOI 10.3233/IDADOI 10.3233/IDA--20102010--04430443
�� Aída Jiménez, Fernando Berzal & Juan Carlos Cubero: Aída Jiménez, Fernando Berzal & Juan Carlos Cubero: POTMinerPOTMiner: Mining ordered, unordered, and partially: Mining ordered, unordered, and partially--ordered ordered treestrees, , Knowledge Knowledge and Information System 23(2): 199and Information System 23(2): 199--224, 224, 2010. 2010. Knowledge Knowledge and Information System 23(2): 199and Information System 23(2): 199--224, 224, 2010. 2010. DOI 110.1007/s10115DOI 110.1007/s10115--009009--02130213--33
�� Aída Jiménez, Fernando Berzal & Juan Carlos CuberoAída Jiménez, Fernando Berzal & Juan Carlos Cubero::Mining Mining frequent patterns from XML data: frequent patterns from XML data: Efficient Efficient algorithms algorithms and and designdesign tradetrade--offsoffs. . Expert Expert Systems with Systems with Applications 39(1):1134Applications 39(1):1134--1140, 2012. 1140, 2012. DOI 10.1016/j.eswa.2011.07.113DOI 10.1016/j.eswa.2011.07.113
�� Aída Aída Jiménez, Fernando Jiménez, Fernando Berzal & Juan Carlos Cubero: Berzal & Juan Carlos Cubero: InterestingnessInterestingness measuresmeasures forfor associationassociation rules rules withinwithin groupsgroups..IntelligentIntelligent Data Data AnalysisAnalysis 17(2):19517(2):195--215, 2013. 215, 2013. DOI 10.3233/IDADOI 10.3233/IDA--130574130574
�� Fernando Fernando BerzalBerzal, , Juan Carlos Juan Carlos CuberoCubero & & AídaAída JiménezJiménez: : Hierarchical Hierarchical program representation for program element matchingprogram representation for program element matching. . Proceedings Proceedings of the 8th of the 8th International Conference International Conference on Intelligent on Intelligent Data Engineering Data Engineering and and Automated Learning Automated Learning (IDEAL'07(IDEAL'07), pp. 467), pp. 467--476. DOI 10.1007/978476. DOI 10.1007/978--33--540540--7722677226--2_482_48
�� AídaAída JiménezJiménez, Miguel Molina, Miguel Molina--Solana, Fernando Solana, Fernando BerzalBerzal & & Waldo Waldo FajardoFajardo: : Mining Mining transposed motifs in musictransposed motifs in music. . Journal of Intelligent Information Systems 36(1):99Journal of Intelligent Information Systems 36(1):99--115, 2011. 115, 2011. Journal of Intelligent Information Systems 36(1):99Journal of Intelligent Information Systems 36(1):99--115, 2011. 115, 2011. DOI 10.1007/s10844DOI 10.1007/s10844--010010--01220122--77
�� AídaAída JiménezJiménez, Fernando , Fernando BerzalBerzal & & JuanJuan--Carlos Carlos CuberoCubero: : Mining Mining patterns from longitudinal studiespatterns from longitudinal studies. . Proceedings Proceedings of the 7th international conference on Advanced Data Mining and Applications of the 7th international conference on Advanced Data Mining and Applications ((ADMA'11), ADMA'11), pp. 166pp. 166--179179. . DOI 10.1007/978DOI 10.1007/978--33--642642--2585625856--5_135_13
�� Aída Jiménez, Fernando Berzal & Juan Carlos Aída Jiménez, Fernando Berzal & Juan Carlos Cubero: Cubero: Using Using trees to mine trees to mine multirelationalmultirelational databasesdatabases. . Data Mining and Knowledge Discovery 24(1):1Data Mining and Knowledge Discovery 24(1):1--39, 2012. 39, 2012. DOI 10.1007/s10618DOI 10.1007/s10618--011011--02180218--xx