Sparse modeling en redes complejas Marcelo Fiori Tutores: Dr. Pablo Mus´ e, Dr. Guillermo Sapiro Universidad de la Rep ´ ublica, Instituto de Ingenier´ ıa El´ ectrica 1. El Problema I Descubrir interacciones entre entidades I Formulaci ´ on e interpretaci ´ on gr ´ afica: Dados datos (X 1 ,..., X p ) ∼ N (0, Σ) estimar el soporte de Σ -1 . I Propiedad: Si X i y X j son cond. indep. ⇒ Σ -1 ij = 0 Grafo de independencia condicional: mismo soporte que Σ -1 I Regresi ´ on: X matriz de datos k × p (en general k < p 2 ) min B ||X - XB|| 2 F + λ||B|| 1 s.t. B simetrica diag(B) = 0 (1) Norma || · || 1 favorece sparsity. 2. Aplicaciones Gene Regulatory Networks Brain connectivity networks Datos: Microarray fMRI Aristas: Regulaci ´ on Conectividad funcional 3. Agregando Estructura Centralidad: I Una medida de centralidad: vector propio dominante. I ¿C´ omo imponer info previa sobre centralidad? min B ||X - XB|| 2 F + λ||B|| 1 -hBc, ci s.t. B simetrica diag(B) = 0 (2) I Problema convexo I Algoritmos eficientes para resolverlo Motifs: I Favorecer aparici ´ on de motifs triangulares. I (B 2 ) ij cuenta caminos de largo 2 entre i, j I Proceso iterativo: min B ||X - XB|| 2 F + λ 1 ||M · B|| ‘ 1 , s.t. B simetrica diag(B) = 0 (3) con M ij = e -μ(B 2 ) ij . Colaborativo: I Group Lasso: sparsity a nivel de grupos I Ejemplo: Con varios fMRI, estimar un ´ unico grafo. min A 1 ...A n X i ||X i - X i A i || 2 F + λ X i,j ||(A 1 ij ,..., A n ij )|| 2 s.t. A i simetrica diag(A i ) = 0 4. Algunos Resultados Grafo original, estimado con modelo simple e imponiendo centralidad. 0 0.005 0.01 0.015 0.02 0.025 0.4 0.5 0.6 0.7 0.8 0.9 1 False Positive Rate True Positive Rate ROC: modelo simple vs. con centralidad US CA AU JP HK UK GE FR IT SW NE AT SP BE FN PO IR GR Datos de Stock Market Comparaci ´ on para E. coli network. Original, estimada con (1) y estimada con (2) y (3) combinados. http://iie.fing.edu.uy mfiori@fing.edu.uy