Bayesian Sets Ghahramani and Heller ’05 (@NIPS)
Jan 08, 2016
Bayesian Sets
Ghahramani and Heller ’05 (@NIPS)
רון בגליטר 2008 2
הקדמה
על הבעיה אותה ג'אהרמאני והלר ניסו לפתור
ועל הקשר של העבודה שלהם לקורס
רון בגליטר 2008 3
הגדרת הבעיה
תהי קבוצה של עצמים
"הקלט: תת-קבוצה המסמלת "מושג
-הפלט: השלמה של עם עצמים מהשייכים לאותו ה"מושג"
רון בגליטר 2008 4
דוגמא
לדוגמא תהיה אוסף של סרטים
:קלט
? :פלט
רון בגליטר 2008 5
פתרון אפשרי
נדרג את העצמים ב: לפי "התאמתם" לקבוצההנתונה
":ההתאמה" "ראינו קבוצה שמייצגת "מושגעד כמה סביר ש- יהיה שייך לאותו המושג
רון בגליטר 2008 6
דירוג עצמים
:מדד הדירוג
:או לחילופין
רון בגליטר 2008 7
המשמעות של המדד
:עצמים ב"מושג" מוגרלים באופן נניח I.I.D. -מ :המדד הוא השוואה בין המודלים
רון בגליטר 2008 8
Bayesian Setsאלגוריתם:
:רקע קבוצה-מודל פרמטרי וprior
:שאילתא קלט
לכל חשב את
:סדר יורד על לפי תוצאות המדד פלט
רון בגליטר 2008 9
חישוב המדד
מניחים אי :תלות
מכנה:
מונה:
רון בגליטר 2008 10
מודל פרמטרי: ברנולי
:העצמים הם ווקטורים בינארייםלכל קורדינטה נתאים מטבע ברנולי
:התפלגות ברנולי
-הprior:הוא
Prior: על
רון בגליטר 2008 11
score(x)נוסחא סגורה ל-
:הצבה של הערכים ופישוט הנוסחא נותן
וקטור בינארי לכל קורדינטה משערך-ית של הוקטורjקורדינטה מטבע ניפרד
רון בגליטר 2008 12
(המשך)score(x)נוסחא סגורה ל-
:אפשר להמשיך ע"י לקיחת לוגריתם
כאשר,
רון בגליטר 2008 13
Bayesian Setsהקוד של
function s = r_bsets(X,query,alpha,beta) %matlab code M = length(query);Dc = X(:, query); c = sum(log(alpha+beta)-log(alpha+beta+M) + log(beta+M-sum(Dc,2)) - log(beta));q = log(alpha+sum(Dc,2))-log(alpha) - log(beta+M-sum(Dc,2)) + log(beta); s = c + q‘ * X;
function s = r_bsets(X,query,alpha,beta) %matlab code M = length(query);Dc = X(:, query); c = sum(log(alpha+beta)-log(alpha+beta+M) + log(beta+M-sum(Dc,2)) - log(beta));q = log(alpha+sum(Dc,2))-log(alpha) - log(beta+M-sum(Dc,2)) + log(beta); s = c + q‘ * X;
רון בגליטר 2008 14
דוגמא אמפירית: המלצות סרטים
נעבוד עם נתוני אתר המלצת הסרטיםMovieLens
1700סרטים ~950 סרטים)20~ מדרגים (כ"א דירג לפחות 1-5הדירוג = ציון
וקטור מציין סרט-תכונית מציינת דירוג של המדרג הi 1, הערך
, אחרת אפס3אם הדירוג גדול מ: משערכים)950נזכיר: יש לנו משערך לכל תכונית (כלומר
רון בגליטר 2008 15
דוגמאת הרצה
Hands-onקוד התוכנית + הנתונים מצורפים
רון בגליטר 2008 16
סיכום
:ראינו שימוש של שיטות בייסיאניות לאיחזור מידע "הגדרנו את הבעיה כבעיית "אי-תלותהשתמשנו במודל הסתברות פרמטריהשוואת סבירות מודל (מבנה) פתרה את אי-התלותשימוש במודל פרמטרי מתאים = מימוש יעיל
הבחירות היו פשוטותקשה להעריך את התוצאות באופן אובייקטיביאבל הן "נראות" סבירות