Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4 Acceleratori hardware del calcolo ad alte prestazioni Comparazione della performance di un algoritmo di ottimizzazione matematica su piattaforme FPGA, GPGPU e x86_64 [email protected]
43
Embed
Acceleratori hardware del calcolo ad alte prestazioni
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Acceleratori hardware del calcolo ad alte prestazioni
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Perché hpc e architetture complesse?
Il calcolo deve rispondere ad esigenze sempre più ardue …
Un esempio:
• Un tipico dato di input della sismica a riflessione
Premessa
1km
3 km
Top salt surface, color map is related to the depth
1km
3 km
Top salt surface, color map is related to the depth
1km
3 km
1km1km
3 km3 km
Top salt surface, color map is related to the depth
2D
100 MB
Anni ’90
3D
Quasi un TB6 ordini di grandezza in più!
Oggi
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Perché hpc e architetture complesse?
Un altro esempio:
Premessa
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Di cosa NON parleremo
• Quale architettura è meglio delle altre in termini di possibili prestazioni medie o di picco a seconda del campo di applicazione oppure in termini di consumo a parità di velocità di calcolo per operazioni più o meno complesse
• Di calcolo numerico e metodi più rapidi per trovare i minimi o i massimi di una funzione pluridimensionale, non lineare, non regolare ecc.
• Di linguaggi di programmazione che siano per la programmazione strutturata o orientata agli oggetti oppure linguaggi specifici quali Cuda o OpenCL, VHDL o Verilog
Premessa
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I due concetti che vorremmo sottolineare …
Premessa
Rispettare la legge di Moore è sempre più difficile• «Le prestazioni dei processori, e il numero di transistor ad esso relativo,
raddoppiano ogni 18 mesi».
• Ma il raggiungimento dei limiti fisici per la riduzione delle dimensioni dei transistor è ormai raggiunto
Le esigenze di calcolo crescono• la soluzione non può essere più computer o computer più grandi
• Si richiede troppo in termini di consumi e infrastrutture
La soluzione è tornare al semplice
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I due concetti che vorremmo sottolineare …
Premessa
La soluzione è tornare al semplice
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I due concetti che vorremmo sottolineare …
Premessa
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I due concetti che vorremmo sottolineare …
Computation
Computation
MaxelerOs
Premessa
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I due concetti che vorremmo sottolineare …
Premessa
• Spostare la gestione del dato dall’hardware al software
• Ad esempio:• avvicinare il dato all’unità di calcolo
• decidere la sequenza delle operazioni
• L’infrastruttura è a carico del programmatore
• FPGA o le GPGPU sono coprocessori
• Necessitano di essere inseriti in una macchina completa
• Non possono sostituire le CPU
• Elevate prestazioni di picco con minori consumi e costi
La soluzione è farsi aiutare da
hardware semplice ma efficiente
La soluzione è
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I due concetti che vorremmo sottolineare …
Non c’è un’infrastruttura per l’HPC migliore delle altre, ma ènecessaria una valutazione globale del problema:
• Costi dell’hardware, Consumi e spese di mantenimento
• Possibilità di portare il problema nell’architettura specifica
• Complessità del problema da affrontare e costi di sviluppo
• Quantità di dati da elaborare
• Precisione necessaria per risolvere il problema
• Velocità d’elaborazione
• Mantenimento dell’applicazione nel tempo
• Frequenza dei possibili crash del sistema nel suo complesso
Valutare il problema globalmente, hardware compreso
Premessa
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I due concetti che vorremmo sottolineare …
Premessatre
• Cercare di avere una visione globale dei problemi
• Non si può essere specializzati in tutto (ma in qualcosa si!)
• Sapere chi può affrontare e risolvere argomenti specifici
• Lavoro d’equipe (che non vuol dire nessuna responsabilità …)
• Facilità nell’inserire nuove persone, conoscenze
• Cercare le collaborazioni necessarie
• sapere cosa cercare e cosa offrire
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Imaging and Numerical Geophysics
• Gruppo di ricerca di 8 persone con differente back-ground • 4 fisici: Ernesto Bonomi, Antonio Cristini, Guido Satta e Zeno Heilmann (geofisico)
• Lavora nel campo della sismica a riflessione in collaborazione con l’industria petrolifera da circa 17 anni
• Capacità di autofinanziamento di più del 120%
• Inserito nel settore: Energy and Environment diretto daErnesto Bonomi con diversi interscambi interni
• Diverse le collaborazioni ancora attive con:• Importanti società di hardware e software
– Nvidia – AMD – Maxeler – …
• I più importanti dipartimenti universitari di geofisica
– Karlsruhe – Imperial College London – Università di Pisa
Chi siamo
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Sommario
Acceleratori hardware del calcolo ad alte prestazioni
Contesto: cos’è la sismica a riflessione
Common Reflection Surface Stack o CRS-stack
CRS: metodo Data-Driven
Parallelizzazione
L’applicazione CRS in tre diverse architetture
Una slide sui progetti futuri
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Cosa è un giacimento di gas e petrolio
• Non è un lago di petrolio e gas.
• È una formazione porosa (rocce) che li racchiude;
• Una depressione della crosta terrestre che sprofondandoha accumulato sedimenti e materiale organico
• La varietà è pressoché infinita:
• Strati piatti di roccia;
• Strati curvi verso il basso;
• Strati fratturati, dislocati e inclinati.
Sismica a riflessione
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Alla ricerca del giacimento
• Finché non è trivellato un pozzo, è difficile confermare la presenza di risorse utilizzabili …
• Il costo di una trivellazione è stimato a:• 0,5-8 M$ per depositi “onshore”;
• 10-30 M$ per depositi in acque poco profonde;
• Oltre 100 M$ per depositi in acque profonde;
• Necessità di metodi per la previsione della presenza di giacimenti
• Tre fasi:• Studio della superficie terrestre per costruire un primo modello di sottosuolo
• Sondaggio del sottosuolo, principalmente con metodi acustici
• Misure da pozzo
Sismica a riflessione
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Che cosa è la sismica a riflessione …
• Il principale strumento di prospezione dell’industria petrolifera;
• È utile anche in campo civile, ambientale e della ricerca geologica di base;
• Usa molti concetti matematici sia originali sia mutuati da altre branche della matematica applicata;
• L’elaborazione sismica richiede ingenti risorse di calcolo e di archiviazione dati;
• È un’attività che vale oltre 4 miliardi di dollari all’anno.
Sismica a riflessione
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
La sismica o ecografia del sottosuolo
È il metodo di esplorazione che utilizza i principi della sismologia per stimare le proprietà del sottosuolo a partire da onde sonore indotte, in seguito riflesse.
Registrando il tempo di volo dell’eco e la sua intensità, èpossibile stimare la profondità della superficie riflettente;
Sismica a riflessione
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
I dati sismici
• Una traccia sismica è la registrazione degli echi retro-propagati dalle discontinuitàdel sottosuolo
• Le esplorazioni sismiche producono enormi quantità di dati:• Ciascuna esplorazione prevede 103 / 105 shots
• Ogni shot comporta circa 100-200 ricevitori
• Ciascun ricevitore registra circa 1500 campioni
Si sfiora facilmente un TB di dato a singola precisioneSi sfiora facilmente un TB di dato a singola precisione
Sismica a riflessione
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
Processing dei dati sismici
• Correzione dell’ampiezza
• Operazioni di Filtraggio
• Deconvoluzione
• Analisi di velocità
• Stacking
• Migrazione
Sismica a riflessione
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
-5000
-4500
-4000
-3500
-3000
-2500
-2000
-1500
-1000
-500
0
0 2000 4000 6000 8000 10000 12000
V0=1400 m/s
V1=2000 m/s
V2=3400 m/s
( )hHKHhmHKHmmw TzyNIPzy
TTzyNzy
TT ++
+=
0
0
2
00
2 22
v
t
vtthyp
S GS=GS=Gm
Common Reflection Surface Stack
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
-5000
-4500
-4000
-3500
-3000
-2500
-2000
-1500
-1000
-500
0
0 2000 4000 6000 8000 10000 12000
V0=1400 m/s
V1=2000 m/s
V2=3400 m/s
( )hHKHhmHKHmmw TzyNIPzy
TTzyNzy
TT ++
+=
0
0
2
00
2 22
v
t
vtthyp
S GS=GS=Gm
Common Reflection Surface Stack
• È un esperimento virtuale nel qualesorgente e ricevitore coincidono (tracce zero-offset)
• È una raccolta del segnale riflesso nello stesso punto(o in un intorno molto vicino) del segnale zero-offset
• Come realizzarla?• Ipotizzando un modello di volo del segnale nel terreno
• Raccogliendo il segnale al tempo ipotizzato
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4
La formula del TravelTime
( )hHKHhmHKHmmw TzyNIPzy
TTzyNzy
TT ++
+=
0
0
2
00
2 22
v
t
vtthyp
Common Reflection Surface Stack
0xSG
mSG
h −+=−=2
;2
Bortfeld R., (1989). Geometrical ray theory: Ray and traveltimes in seismic systems (second-orderapproximations of the traveltimes): Geophysics, 54, no.3, 342–349.
Cervený V. (2001). Seismic ray theory. Cambridge University Press.
Höcht, de Bazelaire E., Majer P., Hubral P. (1999). Seismicsand optics: hyperbolae and curvatures: J. of AppliedGeophysics no. 42, 261–281.
Höcht G., (2002). Traveltime approximations for 2D and 3D media and kinematic wavefield attributes, doctors’thesis. Universität Karlsruhe.
Collana di seminari per la valorizzazione dei Risultati della Ricerca del CRS4