Graph-Based Sybil Detection Matteo D’Angelo Falsi Profili nei Social Network Sybil Detection Sybil Detection con Machine Learning Graph-Based Sybil Detection Random Walk Conduttanza Progettazione Grazie per l’Attenzione! Graph-Based Sybil Detection: a caccia di falsi profili nel grafo di un Social Network Candidato: Relatori: Matteo D’Angelo Prof. Marco Liverani Dott. Stefano Guarino UNIVERSITÀ DEGLI STUDI ROMA TRE Tesi di Laurea Magistrale in Matematica Università degli Studi Roma Tre Anno Accademico 2014/2015 Matteo D’Angelo (Roma Tre) Graph-Based Sybil Detection Anno Accademico 2014/2015 1 / 13
16
Embed
Università degli Studi Roma TreUNIVERSITË DEGLI STUDI ROMA TRTesi di Laurea Magistrale in MatematicaE Università degli Studi Roma Tre Anno Accademico 2014/2015 Matteo D’Angelo
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Graph-BasedSybil Detection
MatteoD’Angelo
Falsi Profili neiSocial Network
Sybil Detection
Sybil Detectioncon MachineLearning
Graph-BasedSybil Detection
Random Walk
Conduttanza
Progettazione
Grazie perl’Attenzione!
Graph-Based Sybil Detection:a caccia di falsi profili nel grafo di un
Social Network
Candidato: Relatori:
Matteo D’Angelo Prof. Marco Liverani
Dott. Stefano Guarino
UNIVERSITÀ DEGLI STUDI
ROMATRE
Tesi di Laurea Magistrale in MatematicaUniversità degli Studi Roma Tre
Nell’ambito dei Social Network, un profilo che non corrisponde allavera identità di una persona viene tipicamente denominato Sybil edi conseguenza un attacco basato su falsi profili viene chiamatoSybil Attack.
Le due principali categorie di schemi utilizzati per contrastare laproliferazione di falsi profili nei Social Network sono:
Classificatori basati su Machine Learning
Classificatori basati su Grafi
L’obiettivo comune di entrambi gli approcci è quello di attribuire unpunteggio ad ogni profilo che rappresenta la probabilità che essisiano onesti o Sybil.
Possiamo definire un Social Network come un grafo G = (V ,E) in cuiogni vertice o nodo v ∈ V rappresenta un’identità “virtuale” e ognispigolo (u,v) ∈ E una ben definita relazione tra le due identità u e v .
Possiamo definire un Social Network come un grafo G = (V ,E) in cuiogni vertice o nodo v ∈ V rappresenta un’identità “virtuale” e ognispigolo (u,v) ∈ E una ben definita relazione tra le due identità u e v .
La conduttanza di un grafo descrive la “compattezza” del grafo, ovverola probabilità che una passeggiata aleatoria su esso raggiunga le partipiù isolate. Formalmente, dato un grafo G = (V ,E) e S ⊆ V definiamo ilvolume di S come
vol(S) = ∑v∈S
deg(v)
mentre il taglio indotto da S come
cut(S) = { (u,v) ∈ E : u ∈ S e v ∈ (V rS)}
Allora la conduttanza indotta dal taglio S è definita come
ϕ(S) =|cut(S)|vol(S)
e descrive la “facilità” con cui una passeggiata aleatoria iniziata in Sriesca ad uscire da S.
Definizione
La conduttanza del grafo G è definita come la minima conduttanza sututti i possibili tagli:
L’idea alla base di questi schemi è quella di attribuire un valore diranking ad ogni nodo attraverso le passeggiate aleatorie.L’identità di un nodo dipende dal punteggio ottenuto e vienestabilità in base al superamento di una certa soglia, scelta inmaniera tale da minimizzare la conduttanza del taglio indotto dalpartizionamento in regione onesta e Sybil.
A causa delle smisurate dimensioni del grafo che rappresenta unSocial Network, non è possibile avere una visione d’insieme di esso equindi è necessario utilizzare le passeggiate aleatorie per esplorarlo.Tipicamente vengono realizzate un certo numero di passeggiate dilunghezza l ∈ O(logn) e ne vengono considerate le loro intersezioni.Viste le ipotesi sulla struttura del grafo, c’è un alta probabilità che i nodionesti ottengano un alto punteggio e quelli Sybil un basso punteggio.