1 UNIVERSITÀ DEGLI STUDI DI MILANO BICOCCA SCUOLA DI ECONOMIA E STATISTICA Master di I livello: Business Intelligence e Big Data Analytics Facebook social analytics: dagli Insights all’Utente Tutor aziendale: Coletto Valentino Correlatore: Relazione finale : Davide Tiana Matr. n.799455 Anno Accademico 2014/2015
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
UNIVERSITÀ DEGLI STUDI DI MILANO BICOCCA SCUOLA DI ECONOMIA E STATISTICA
Master di I livello: Business Intelligence e Big Data
Gara Gruppo Volkswagen Italia ........................................................................................................................ 4
Analisi del mercato competitive automotive Italia ........................................................................................ 4
Text Mining ............................................................................................................................................... 5
Dati Strutturati ........................................................................................................................................... 6
Appendice A .................................................................................................................................................... 13
Appendice B .................................................................................................................................................... 14
Appendice C .................................................................................................................................................... 22
sviluppare sentiment e text mining sui post degli utenti.
Dashboard
La Dashboard è divisa in tre sezioni 4 sezioni che contengono grafici coerenti
soggetto cui le statistiche si riferiscono e si può accedere alle sezioni da una
barra posta sulla sinistra:
Page KPI contiene le statistiche della pagina e sui Fans
Posts KPI contiene statistiche sui post pubblicati dalla pagina, quindi
esclusi quelli degli utenti
Users contiene le statistiche sui post degli utenti
Help è composto di due sottosezioni: un breve riepilogo delle definizioni
delle metriche usate ed un “about” dove inserire i dati
dell’azienda,contatti,riferimenti.
In generale tutta la Dashboard è stata sviluppata dal sottoscritto, incluse le parti
di codice HTML ove utilizzato.
Indubbiamente non ha la pretesa di brillare per estetica, ma ha il vantaggio di
poter essere migliorata con altro codice HTML aggiungendo sfondi, icone più
“carine” e quant’altro si voglia.
Page KPI
La sezione che mostra le statistiche delle pagine a confronto è quella che si presenta all’apertura della
Dashboard
Il primo box in alto mostra l’andamento temporale delle metriche che si possono selezionare dalla checkbox
posta sulla barra di sinistra; il grafico superiore mostra i dati per una delle due pagine selezionate per il
confronto, qui chiamata “Competitor” e si tratta di dati puramente inventati imputandoli direttamente su una
copia degli Insights di NOBdata, mentre il grafico inferiore sono esattamente i dati della pagina NOBdata,
indicata come “Target” che abbiamo creato per i motivi spiegati nei paragrafi precedenti.
10
Nei grafici dei due box inferiori vengono mostrate alcune statistiche dei Fans: le ripartizioni per genere,
classe di età e nazione; ma la scelta di cosa mostrare è assolutamente arbitraria ed andrebbe concordata con
un eventuale committente.
Posts KPI
la sezione dedicata alle statistiche dei post della pagina in realtà si apre, primo box in alto, con una misura
che non ha a vedere direttamente coi post della pagina.
In effetti questa sezione, nell’ottica che la Dashboard sia utilizzata da un community manager, è pensata non
solo per valutare l’efficacia dei post già pubblicati, ma anche per pianificare le prossime pubblicazione. Ecco
quindi che i primi grafici che mostrano quando sono online i Fans delle due pagine potranno essere un utile
indicazione su quando è meglio pubblicare un post, ad esempio evitando di comunicare un evento fissato per
sabato durante i feriali precedenti se sappiamo dai grafici di cui sopra che i nostri Fans si collegano soltanto
durante il week-end; l’evento andrà in questo caso comunicato almeno prima del sabato precedente l’evento
stesso. In questi due grafici la colorazione delle barre è stata utilizzata soltanto per distinguere le domeniche
in rosso (ma potrebbe essere considerato festivo anche il sabato) dagli altri giorni feriali, così da facilitare la
lettura al nostro community manager od a chi per esso.
Nel secondo box vengono visualizzati i valori delle metriche per ogni singolo post, vengono selezionati i
primi n (è da aggiungere un controllo per permettere di scegliere n) in base alla metrica selezionata, con un
flag sulla barra è anche possibile limitare il calcolo delle metriche ai soli Fans oppure lasciarlo calcolato su
tutti gli utenti. Il grafico volutamente non ha etichette di identificazione del post, perché selezionando le
barre del grafico automaticamente si dovrebbe evidenziare il post nella tabella sottostante, ma al momento
questa caratteristica non è funzionante e sfortunatamente non era più disponibile un backup per ripristinare il
grafico colle etichette dopo il tentativo di implementazione di questi ultimi giorni.
Da notare che soggiacente al messaggio nella tabella è attivo un link che automaticamente apre il post in una
nuova scheda del browser.
11
Users
In questa sezione l’attenzione si sposta sulle attività degli utenti: post, Likes, Comments,
Shares,Photos,Links,Videos,…
Fortunatamente, o forse volutamente, Facebook non rende disponibili le statistiche per queste attività (ad
esempio la Reach o le Impressions di un Link postato da un utente) e quindi si è dovuta valutare l’efficacia
delle attività degli utenti in altro modo.
Nel grafico di questa sezione come Activity Level si è preso il conteggio di ogni azione fatta da ciascun
utente e come Reach Level la somma dei Likes, Comments and Shares ottenuti da ciascun attività
dell’utente.
Ovviamente il Reach Level così calcolato non corrisponde alla Reach così come l’avevamo definita nella
presentazione delle metriche di Facebook, ma è la miglior stima che possiamo dare sulla base dei dati
disponibili, inoltre occorre tenere presente che non tutte le attività dell’utente hanno Likes, Comments, … ad
esempio un Like non può a sua volta ricevere un Like od un commento.
Ovviamente gli utenti su cui si dovrà maggiormente concentrare l’attenzione del community manager
saranno quelli che si posizionano in alto a destra nel grafico.
Anche per questo grafico sarebbe prevista la caratteristica che clickando su un punto del grafico si evidenzia
il record corrispondente nella tabella, ma è ancora in fase di implementazione.
Nella tabella soggiacente il nome dell’utente c’è nuovamente un link attivabile che apre in una nuova scheda
il profilo Facebook dell’utente; potenzialmente con ulteriori sviluppi dell’applicazione si potrebbero estrarre,
via scrapping, i dati più interessanti della pagina dell’utente e mostrarli in modo strutturato in un nuovo box
in questa sezione. Magari addirittura aggiungere una componente che faccia text mining e/o sentiment sui
contenuti dell’utente per fornire al nostro community manager qualche informazione in più sugli utenti “a
maggior valore”.
12
Conclusioni
L’originalità del progetto sviluppato e descritto in queste pagine rispetto ai molti prodotti commerciali
esistenti consiste nel tentativo di scendere fino al dettaglio degli utenti ingaggiati dai nostri contenuti social,
potremmo quasi dire il tentativo di dare un volto a quelle persone che in tanti altri analytics compaiono solo
come numeri.
Due ultime considerazioni sugli aspetti critici di questo progetto:
Credibilità dei dati presenti in Facebook
Incertezza sul significato dei dati utilizzati.
Quando parliamo di credibilità dei dati ci riferiamo al fatto che su Facebook ed in generale sui social
esistono milioni di profili finti creati dagli utenti per svariati motivi, ad esempio i quaranta e più profili che
ho creato io per avere una base dati per questo progetto. Una possibile risposta a questo problema potrebbe
essere che comunque anche un profilo finto, per quanto i dati inseriti siano inventati, rappresenta una “faccia
sociale” dell’utente e che quindi in qualche modo rispecchia comunque l’utente
Per incertezza del significato dei dati ci riferiamo invece alle già citate discussioni aperte sulla vaghezza
delle definizioni date da Facebook e dagli altri social. Questa seconda criticità sarebbe facilmente risolvibile
dedicando a progetti di questo tipo anche il tempo necessario per verificare con test diretti ciascuna metrica
quali azioni e effettuate dove stia misurando.
Ovviamente essendo ben consci che un tal genere di verifica diretta andrebbe rifatta ogni sei mesi/ un anno
perché nel frattempo Facebook od un altro social avranno già cambiato tutto, sostituendo ad esempio i Likes
con una nuovo set di gradimenti.
13
Appendice A
Estratto bando di gara: attività richieste al vincitore
Estratto bando di gara: esercizi richiesti
ESERCIZIO 1. Sulla base di quello che avete compreso del Brand SEAT, del suo tono di voce e della sua Corporate
Identity, presentate una proposta di piano editoriale settimanale per il canale Facebook in grado,
secondo voi, di rappresentare quello che proporreste come attività social e modalità di
comunicazione in caso di scelta della vostra agenzia.
…
ESERCIZIO 2. Di seguito trovate una lista di temi che potrebbero esservi proposti come argomenti da sviluppare sui
canali social. Indicate in quali canali e con quale modalità intendete svilupparli.
…
ESERCIZIO 3. Sulla pagina social di SEAT Italia, appare questo commento: “belle le auto ma la consulenza offerta
dal Concessionario Rossi di Milano è stata davvero scarsa”.
…
ESERCIZIO 4. Secondo l’idea e l’esperienza che vi siete fatti, quali obiettivi può porsi un brand automotive
nell’utilizzo dei canali social?
…
ESERCIZIO 5. Viene richiesto di fornire un esempio di report (anche con numeri oscurati) che fornite ai vostri
clienti e che rispecchi la vostra filosofia. Vi chiediamo di specificare quali KPIs vanno monitorati
secondo la vostra esperienza, per monitorare correttamente le attività social del nostro brand.
…
A) Gestione quotidiana delle pagine social del brand SEAT per il mercato italiano
B) Creazione di una strategia a medio-lungo termine per il profilo Youtube
C) Collaborazione nello sviluppo della strategia di comunicazione on e offline
D) Redazione di reportistica sui singoli social network
E) Analisi, almeno, trimestrale di ascolto della rete
F) Analisi, almeno, trimestrale del contesto competitivo automotive o extra-settore
G) Gestione delle attività di Digital PR
14
Appendice B
Analisi Mercato Competitivo Automotive Il presente documento costituisce una breve analisi del mercato delle automobili in Italia, basato su dati estratti dalle
pubblicazioni del UNRAE (Unione Nazionale Rappresentanti Autoveicoli Esteri). Nel documento analizzeremo i trend
generali del mercato e in modo più dettagliato i segmenti su cui si confronta il gruppo GVI (Gruppo Volkswagen Italia)
limitatamente ai brand Skoda, Seat ed Audi.
Analisi generale del mercato automotive A seguito della crisi economica globale di questo inizio millennio, il mercato delle automobili si è progressivamente
ridotto sino a raggiungere il minimo di 1.3 milioni di immatricolazioni nel 2013 (“2015 Market Insight”, C. Petrucci).
Dal secondo semestre 2014 il mercato segna una leggera ripresa che sembrerebbe però essersi già esaurita negli ultimi mesi del 2015 (FIGURA 1).
La suddivisione in macroaree geografiche(FIGURA 2) mostra come tutto il Nord Italia sia il mercato trainante con il Sud Italia e le isole relegate a rappresentare piccole frazioni soltanto del mercato.
15
Per quanto concerne i combustibili(FIGURA 3), gli italiani mostrano di preferire decisamente diesel e benzina rispetto ad altre vettori energetici, anche se occorre osservare che le motorizzazioni a gas liquidi o gassosi(GPL e metano) hanno una loro quota di mercato abbastanza stabile. Notevole osservare che le motorizzazioni ibride, sebbene rappresentino ancora in Italia una frazione minore delle auto immatricolate, mostrano una piccola ma costante crescita lungo tutti i tre anni osservati. La crescita è maggiore di quella del mercato in generale che possiamo pensare rappresentata dalle linee di tendenza di diesel e benzina e quindi in prospettiva questo segmento potrebbe rivelarsi interessante nei prossimi anni.
in FIGURA 4 mostriamo le immatricolazioni per tipo di carrozzeria usando solo le linee di tendenza derivate dai dati per aumentare la leggibilità del grafico stesso. Le berline restano la tipologia di carrozzeria preferita dagli italiani ed a seguire i crossover e fuoristrada, ma con numeri decisamente inferiori(notare che il grafico è in scala logaritmica su y). Pur nei loro piccoli numeri però crossover e fuoristrada sono le categoria che mostrano il maggior tasso di crescita, così come i monovolume grandi ma solo limitatamente al secondo semestre 2015.
Segmenti
16
17
18
19
20
21
22
Appendice C
Facebook Metrics definitions
METRIC API DEFINITION
Fans
Sì Number of people who likes your Page
Story
Sì A story is an item that is displayed in your News Feed or
News Ticker
Engaged Users
(Engagement)
Sì number of people who engaged with your Page.
Engagement includes any click or story created. (Unique
Users)
Consumers No
number of people who clicked on any of your content.
Stories that are created without clicking on Page content
(ex, liking the Page from timeline) are not
included. (Unique Users)
Reach
Sì number of people who have seen any content
associated with your Page. (Unique Users)
Impressions
Sì number of impressions seen of any content
associated with your Page.
Consumption
Sì? number of clicks on any of your content. Stories
generated without clicks on page content (e.g., liking the
page in Timeline) are not included.
Engagement
(Rate)
Calcolato Engagement rate is the percentage of people who
saw a post that reacted to, shared, clicked or commented on it