This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
The power of Big Data Investigation and Advanced Analytics to maximize the Data Capital
I dati sono il nuovo Capitale: come il capitale finanziario, sono una risorsa che deve essere gestita, raccolta e tenuta al sicuro, ma deve essere anche investita dalle organizzazioni che vogliono ottenere vantaggio competitivo. I dati non sono una risorsa nuova, ma soltanto oggi per la prima volta sono disponbili in abbondanza assieme alle tecnologie necessarie per massimizzarne il ritorno. Esattamente come l'elettricità fu una curiosità da laboratorio per molto tempo, finchè non venne resa disponibile alle masse e dunque cambiò totalmente il volto dell'industria moderna.Ecco perchè per accelerare il cambiamento è necessario un approccio innovativo alla esecuzione delle iniziative orientate ai Big Data: un laboratorio analitico come catalizzatore dell'innovazione (Data Lab).Vieni a scoprire durante questo webinar, attraverso il racconto di casi d’uso ed esperienze concrete dei suoi clienti, come Oracle mette a disposizione le tecnologie e le soluzioni che le hanno rese vincenti.
“Data Driven Research” reasoning from the data to the
general theory
Machine Learning on the Process
...
Data Discovery in the LabSource data are initially explored to find out
hidden relationships. This is the basis for picking up relevant features to feed prediction models
( “features engineering”).
Induction
Data Scientists
Experts
Advanced Analytics in the MainstreamThe final step is to run ML models as well as new patterns in the mainstream, make their outcome available for the broad users community through
Data Visualization and Business Intelligence.Consumers
Machine Learning in the LabWhen the data context has been outlined and
most relevant features identified, then ML models can be built and evaluated over historical and new
Extends Spark Mllib with R CRAN models and packages
35 built-in Graph Algorithms
Based on Standards
R Language and models
Spark MLLib on Hadoop
Python , Java and Scala Spark
APIs
Gremlin and Blueprints for Property Graph
Transparently move ML models and workloads between on-premise and public cloud
Both on prem and on public
cloud
Cross Technologie
sORE on Oracle
databases
ORAAH, Spark MLlib, Big Data Spatial and Graph on BDA
Real Time Decision and Stream Explorer
Big Data Discovery
Optimized for
performance
ORE and ORAAH are optimezed version of R to exploit parallel processing and hardware capabilities of modern CPUs.
Oracle Engineered Systems enhance ORE, ORAAH and Spark models eleboration shortening time to value.
Thightly Integrated
Machine learning capabilities integrated out-of-the-box throughout the Oracle stack, from data stores, to front end analytics and streaming processing via data integration.
I dati aziendali vengono organizzati in un catalogo. Luigi può visualizzare i dati a cui è stato abilitato all’accesso. Può anche selezionare i dataset in base alle caratteristiche e può immediatamente visualizzarne tutti dettagli
Dopo aver selezionato il dataset dei bonifici, Luigi può immediatamente profilarne il contenuto, visualizzando graficamente la completezza e la distribuzione dei valori di ciascun attributo
Luigi combina più attributi per evidenziarne la correlazione. In questo caso si evidenzia un’inversione per l’anno 2014 del rapporto tra bonifici in ingresso e in uscita. In funzione delle caratteristiche degli attributi Luigi può scegliere tra diverse rappresentazioni grafiche
Filtrando per l’anno 2014 e selezionando solo i bonifici in uscita, Luigi visualizza in ordine descrescente l’ammontare delle transazioni per ciascuna descrizione. Si evidenza una particolare rilevanza di operazioni legate all’acquisto di titoli che lo incuriosisce
Per poter identificare meglio le transazioni d’interesse Luigi definisce una funzione di trasformazione per verificare l’esistenza di determinate parole chiave all’interno della descrizione del bonifico e creare un nuovo attributo. La trasformazione viene aggiunta allo script ed eseguita immediatamente
Per estendere le possibilità di analisi, Luigi aggiunge al progetto il dataset dell’anagrafica clienti e il dataset pubblico contenente tutti i codici ABI e CAB delle banche italiane
Per completare la sua analisi Luigi passa alla vera e propria attività di discovery andando a comporre la pagina con cui rappresenterà i risultati. Partendo da una pagina vuota, seleziona i componenti da una ampia libreria che è comunque possibile estendere con componenti custom
Selezionando solo i bonifici in uscita, che contengono almeno una delle parole chiave ed effettuati da clienti nella fascia di reddito da 30.000 a 50.000 verso tre primarie banche, Luigi identifica i clienti a cui si potrebbero proporre prodotti di investimento
Luigi decide di proporre al marketing questo target per una campagna e per far questo genera un nuovo dataset a cui potrà accedere direttamente il responsabile della campagna
A Barbara, responsabile della campagna di marketing, viene notificata la disponibilità di un nuovo dataset con il target a cui proporre prodotti di investimento. Decide quindi di analizzare la composizione di questo nuovo target
I dati vengono immediatamente visualizzati lasciando la possibilità a Barbara di variare la rappresentazione intervenendo sulle caratteristiche della visualizzazione
Per poter analizzare i dati per provincia di residenza Barbara aggiunge al progetto un nuovo datasource scaricato da internet contenente tutti i comuni italiani
Per finire Barbara aggiunge un grafico per visualizzare la giacenza media per titolo di studio. Selezionando da questo grafico la “fetta” relativa al titolo di media superiore nelle visualizzazione gerografica vengono evidenziate le province in cui risiedono questi clienti
Al termine dell’esecuzione della campagna a Barbara viene fornito un file con il numero di contatti effettuati e il totale delle somme investite per cliente. Anche questo data source viene aggiunto al progetto per la consuntivazione finale
Con i dati di redemption Barbara aggiunge una nuova visualizzazione per evidenzare le filiali su cui si sono ottenuti i maggiori investimenti confrontando anche la giacenza media di partenza e il numero di contatti necessari per ottenere il risultato
• Large Hadron Collider (LHC) is the largest cryogenics system in the world : 27km, +6000 superconductors; 600M collisions per second storing 60TB per year
• Monitoring and Diagnostic system: (temperature, magnetic & electrical fields, pressure) with Data Discovery on 15GB of daily log files
• Run predictive maintenance models on cryogenics faulty valves detection in Oracle Database using R
• Deployed Oracle Big Data Discovery, Oracle Database, Oracle Advanced Analytics
The CERN Accelerator Logging Service is powerful but also brings new challenges due to exploding datasets vs analysis strong time requirements (seconds)
Data Lab To Find Savings and Cost Reductions in Health Care Budget• United Kingdom’s National Health Service• Identify billing and identity fraud• Optimize treatment by reducing use of less
effective medical procedures• Deployed Oracle Advanced Analytics, and
Oracle Business Intelligence on Oracle Exadata and Oracle Exalytics
$156M
“With one vendor providing the whole solution, it’s very easy for us.” - Nina Monckton, NHS BSA
NHS BSA• Responsible for a third of the NHS budget • Manages prescription reimbursement• Delivery of supply chain services to the NHS• NHS Pensions
Challenges• 4 million prescriptions processed/day• 30%+ entered manually • Need to find drugs misuse and fraud & error• Unable to monitor best practice (drug
administration versus outcomes at national level)• Inability to link structured and unstructured data
Preventing Fraud for European Health Insurance CardAnalyzing Billions of Records in Minutes (prescription)analyzing much larger sets of patient data, the NHSBSA can provide insight that is helping to improve standards of care
Analyzing Unstructured Text to Measure Satisfaction
DALL - Data Analytics Learning Laboratory
Data Scientist, Data Consultant , Statisticians ,Data Lab Coordinator , Information and Data Analyst Team initially supported by Oracle experts
Preventing Fraud for European Health Insurance CardAnalyzing Billions of Records in Minutes (prescription)analyzing much larger sets of patient data, the NHSBSA can provide insight that is helping to improve standards of care
Analyzing Unstructured Text to Measure Satisfaction
DALL - Data Analytics Learning Laboratory
Data Scientist, Data Consultant , Statisticians ,Data Lab Coordinator , Information and Data Analyst Team initially supported by Oracle experts
Our target for 2015/16 is to highlight at least £200 million of potential savings for the NHS through the DALL. The thermometer below shows what :
The DALL, however, isn’t purely about saving money as we can also provide valuable insight into patient care, safety, probity and quality within the NHSBSA and wider NHS.