Introducci ´ on Sistemas y Programaci ´ on Paralela Paradigmas de Programaci´ on Paralela Entornos de Programaci ´ on Paralela Metodolog´ ıa de la Programaci´ on Paralela 2014-2015 Facultad Inform´ atica, Universidad de Murcia Introducci ´ on a la Computaci ´ on Paralela Domingo Gim ´ enez ([email protected])
76
Embed
Introduccion a la´ Computacion Paralela´ - dis.um.esdis.um.es/~domingo/apuntes/AlgProPar/1415/sistemasprogramacion.pdf · Un sistema multicore con una tarjeta grafica con su propia
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
IntroduccionSistemas y Programacion Paralela
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Contenido1 Introduccion2 Sistemas y Programacion Paralela3 Paradigmas de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
4 Entornos de Programacion ParalelaEjemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Variedad de sistemas computacionales
Los sistemas computacionales actuales estan constituidos porvarios componentes, por lo que son sistemas paralelos,pero estos componentes estan organizados de formas distintas:
Sistemas con varios cores y una memoria comun a todos
Un sistema multicore con una tarjeta grafica con su propiamemoria
Redes de multicores, cada uno con su memoria yposiblemente su tarjeta grafica
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Conceptos de Programacion Paralela
Paralelismo en sistemas secuencialesConcurrencia - Programacion ConcurrenteParalelismo - Programacion ParalelaSistemas de tiempo real - Programacion en tiempo realSistemas multicoreTarjetas graficas, GPUAceleradores: Xeon Phi, FPGA, DSP...Redes de ordenadores, ClustersComputacion heterogeneaSupercomputacionComputacion de Altas Prestaciones, HPCProgramacion adaptativaComputacion distribuidaComputacion en la nube, CloudComputacion ubicuaVirtualizacionOtros tipos: Computacion Cuantica, Biologica...
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Paralelismo en sistemas secuenciales (II)
Los procesadores actuales consiguen acelerar la ejecucion haciendo uso delparalelismo de forma interna. Ejemplos:
Segmentacion encauzada (pipeline):division de la ejecucion de las instrucciones en etapasuna instruccion empieza a ejecutarse antes de que hayan terminado las anteriores
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Sistemas de tiempo real, Programacion de tiempo real
Para problemas que requieren respuesta en un espacio corto detiempopara lo que se necesita usar de manera eficiente los recursoscomputacionales,y por tanto realizar computacion paralela.Ejemplos:
Vıdeojuegos, Animaciones, que requieren generar al menos24 imagenes por segundo
Control, con informacion recogida por sensores, y el sistematiene que dar respuesta rapida
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Multicore
Los sistemas multicore (multinucleo) contienen varios cores que tienen acceso a unespacio de memoria comun, organizado de forma jerarquica.En la actualidad son los sistemas computacionales estandar, y sistemas mascomplejos se obtienen combinando varios de ellos.Se programan a traves de hilos (threads), que comparten datos en la memoriacomun.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Tarjetas graficas, GPU
Originariamente para vıdeojuegos, en la actualidad tambien para procesamiento deproposito general (GPGPU).Normalmente como coprocesadores con un sistema multicore, que dispone de una ovarias GPUs.El programa se ejecuta en CPU y manda trabajos a la GPU.Programacion dependiente del fabricante (CUDA) y tambien hay software portable(OpenCL).Constan de muchos cores de GPU, organizados en bloques, y con organizacionjerarquica de la memoria.Varios tipos de tarjetas con distintas capacidades computacionales (Gforce, Tesla,Kepler...)
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Otros aceleradores
Los aceleradores computacionales o coprocesadores se utilizan normalmentemandandoles trabajo desde la CPU para que se encarguen de realizar calculoscomputacionalmente costosos.Ademas de las GPUs hay algunos tipos mas:
Intel Xeon Phi:
Contiene hasta 61 cores, y cada core soporta 4 threads por hardware.
Programacion mas cercana que la de las GPUs a la estandar en paralelo.
FPGA (Field Programmable Gate Array):
Similares a circuitos integrados pero reprogramables.
Programacion distinta a la paralela estandar.
DSP (Digital Signal Processor):
Para tratamiento de senales y problemas en tiempo real.
Normalmente para operaciones matematicas que se repite continuamente.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Computacion heterogenea
Los componentes de un sistema computacional presentandistintas fuentes de heterogeneidad:
Memorias primarias y secundarias de distinta capacidad ycon distinta organizacion.Componentes computacionales con distinta velocidad.Componentes computacionales de distinta arquitectura(ejemplo, multicore+GPU).Redes de conexion a distinta velocidad....
lo que hace que haya que programarlos de forma especial paraaprovechar al maximo la capacidad de todos ellos, quizas conprogramacion paralela estandar pero asignacion balanceada detrabajos a los distintos componentes.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Supercomputacion
La que se realiza en loscomputadores mas potentes pararesolver los problemas cientıficos conmayores necesidadescomputacionales (simulacionclimatica, analisis de ADN...)
Varıa historicamente. Lista Top500contiene los 500 mas rapidos delmundo, se actualiza cada seis meses.
Problemas de gestion, sistemas deenfriamiento, reduccion del consumode energıa (Green computing)...
Tianhe-2en el National Super Computer Center inGuangzhou, ChinaCluster de Intel Xeon + Xeon Phi3120000 corespotencia 17808 kwrendimiento maximo 54902.4 Tflops/seg
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
HPC
La Computacion de Alto Rendimiento (o Altas Prestaciones,High Performance Computing) consiste en el aprovechamientoal maximo de las capacidades computacionales del sistema.
Normalmente en supercomputadores, pero tambien enclusters, multicores, y para tiempo real.
Programacion Adaptativa
Al compartirse los grandes sistemas o clusters entre variosusuarios las condiciones de los sistemas cambian a lo largodel tiempo.
Se pueden desarrollar programas que se adapten a lascondiciones del sistema durante su ejecucion.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Cloud computing - Virtualizacion
Computacion en la nube
Uso de recursos computacionales, de almacenamiento, de servicios... ofrecidos atraves de algun sistema como Internet.
Normalmente se refiere a la oferta de los servicios. Hay proveedores de espacio yservicios, incluyendo computacion (por ejemplo, Amazon).
Cuando se ofrece uso de elementos hardware el sistema ofrece esos recursos perono estan siempre asignados fısicamente al mismo hardware.
... Sky Computing, Jungle Computing...
Virtualizacion
Consiste en la oferta y uso de entornos virtuales, ya sea de hardware, sistemas,redes...
Puede permitir un mayor aprovechamiento de los recursos, pues varias maquinasvirtuales pueden estar usando la misma maquina real disminuyenso ası los puntosmuertos.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Computacion no convencionalExisten otros tipos de computacion no convencionales que no estan totalmentedesarrollados y que intrınsecamente incluyen paralelismo.
Computacion cuantica
Basada en las propiedades de la fısica cuantica.
Podrıan realizarse multiples operaciones de forma simultanea.
Requiere forma de programacion distinta a la actual.
Hay ya algunos computadores cuanticos, de alto coste y poca capacidad de computoen terminos cuanticos, pero que resuelven algunos problemas determinados de formamucho mas rapida que con la computacion convencional.
Computacion biologica
Basada en la capacidad de elementos biologicos (moleculas, proteınas, ADN...) paraalmacenar y procesar datos.
Se usa en algunas aplicaciones biologicas y de medicina, pero esta lejos de podertener un uso generalizado.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
SIMD
Una unica unidad de control.La misma instruccion se ejecuta sıncronamente por todas lasunidades de procesamiento.Normalmente se consideran en este paradigma las GPU.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
MC- Sistemas
Los sistemas donde se realiza permitenver la memoria compartida por losdistintos elementos de computacion: losdistintos procesos o hilos,independientemente del procesador onucleo donde esten, tienen acceso directoa todas las posiciones de memoria.
Tıpicamente son sistemas multicore, conmemoria dividida en bloques y organizadajerarquicamente, pero en el programa seconsidera la memoria comun, aunquehabra distinto coste de acceso a los datosdependiendo de donde se encuentren.
Imagen de saturno, con hwloc
Problemas de:coherencia de datos (resuelto por el sistemaoperativo)
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
MC- Regiones crıticasCuando los hilos acceden a zonas comunes de datos para variarlos es necesariasincronizacion. Los entornos de programacion en memoria compartida proporcionanherramientas:
Seccion crıtica: solo un hilo puede estar ejecutando esa parte del codigo en unmomento dado.Llaves, semaforos: se puede acceder a esa zona de codigo cuando se cumple unacondicion.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
Entornos de programacion en Memoria Compartida
C, C++: tienen llamadas a rutinas del sistema, fork, join yotras.
Java: tiene bibliotecas de concurrencia.
Pthreads: interface de programacion (API) para trabajo conhilos.
OpenMP: especificacion de API para programacion paralelaen Memoria Compartida. Se puede considerar el estandarpara computacion en MC.Se encuentra en implementaciones de lenguajes, como gcc.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
PM- Sistemas
En los sistemas donde se realiza esta programacion no sepuede acceder a todas las posiciones de memoria desdetodos los elementos de proceso.Cada nodo o procesador tiene asociados unos bloques dememoria, a los que puede acceder directamente.Un proceso asignado a un procesador, para poder acceder adatos en bloques de memoria no accesibles desde eseprocesador, tiene que comunicarse con procesos enprocesadores a los que esta asociada esa memoria.Son redes (clusters) de ordenadores, formados por nodosmulticore conectados en red, sistemas distribuidos..., perotambien se puede usar programacion por paso de mensajesen sistemas de memoria compartida.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
PM- Procesos
Programa:
Puede haber un unico programa y ponerse en marcha variosprocesos con el mismo codigo. Modelo Simple ProgramaMultiple Dato (SPMD).Aunque sea el mismo programa los codigos que se ejecutanpueden ser distintos si se compila para arquitecturas distintas.Puede haber varios programas y generarse procesos concodigos distintos.
Generacion de procesos:
Generadion estatica: todos los procesos se ponen en marchaal mismo tiempo.Generacion dinamica: unos procesos ponen en marcha otrosdurante la ejecucion.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
PM- Mensajes
Los procesos se comunican con mensajes, que pueden ser:
Segun el numero de procesos:Punto a punto: un proceso envıa y otro recibe.Globales: intervienen varios procesos, posiblemente unoenviando o recibiendo datos de todos los demas.
Segun la sincronizacion:
Sıncronos: los procesos que intervienen se bloquean hastaque se realiza la comunicacion.Asıncronos: los procesos no se bloquean. El que envıamanda los datos y sigue trabajando, el que recibe, si no estandisponibles los datos continua con su trabajo.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
Entornos de programacion por Paso de Mensajes
Java: tiene bibliotecas de paso de mensajes.
MPI (Message Passing Interface): especificacion de API paraprogramacion con Paso de Mensajes. Se puede considerar elestandar para computacion en sistemas distribuidos.API para varios lenguajes: C/C++, Fortran...Varias implementaciones gratuitas: MPICH, LAMMPI,OpenMPI ...
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
SIMD- Sistemas
Modelo SIMD: muchas unidades de proceso, cada unarealizando la misma operacion (SI) y cada una sobre susdatos (MD).
En la actualidad podemos considerar sistemas SIMDcoprocesadores como:
tarjetas graficas (GPU), hasta ≈ 2500 cores. En los sistemaspara graficos, se pueden programar para proposito general.Intel Xeon Phi, entre 57 y 61 cores, cada uno hasta 4 threadspor hardware.
pero tambien hacen computacion de forma asıncrona,normalmente trabajo en CPU y se manda parte delprocesamiento al coprocesador.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
ClasificacionesProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)
GPU- Memoria
Memorias independientes en CPU y GPU.Con jerarquıa de memoria en cada una.Mas compleja la de GPU: optimizar su uso para tener buenas prestaciones.Y necesario minimizar copias entre memorias de CPU y GPU, o solapar las copiascon computacion.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Veremos ejemplos basicos de programacion paralela en:
C/C++ con fork-join
Java
Pthreads
OpenMP
MPI
CUDA
para trabajar con ellos en las sesiones de practicas en ellaboratorio de CCPP y quizas en uno de la U. de Georgia.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Un proceso puede crear un proceso hijo con la funcion fork .
fork devuelve al proceso que lo llama el identificador delproceso hijo, y al hijo el valor cero.
El proceso hijo tiene una copia de las variables del procesopadre.
y ejecuta el mismo codigo del padre a partir de la zona enque se ha creado.
El padre puede usar la funcion wait para esperar que el hijoacabe.
Para que padre e hijo trabajen con datos compartidos hayque utilizar funciones de comparticion de memoria, como porejemplo la mmap .
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: ordenacion con dos procesos
El programa en programas/C/ejemplofork.cpp realiza unaordenacion con dos procesos.Trabajar con el:
Compilarlo con y sin la opcion -D DEBUG. Si se quiereoptimizar el codigo hay que incluir la opcion -O3 en lacompilacion.
Entender su funcionamiento.
Explicar el trabajo de las funciones fork , wait y mmap .
Explicar los tiempos de ejecucion que se obtienen.
Hacer la reserva de espacio para los datos sin usar mmap yanalizar lo que ocurre en ese caso.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Se crea una clase (threadordenar) que implementaRunnable .
el metodo run llama a ordenar la segunda mitad del array.
Los datos y su tamano se declaran globales para que puedanacceder los dos hilos.
Se declara un hilo de esa clase: Thread t = newThread(new threadordenar());
y se inicia su ejecucion con t.start().
El hilo maestro espera mientras el hilo esclavo esta activo:t.isAlive().
En Java hay muchas otras posibilidades de gestionar laconcurrencia.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: ordenacion con dos hilos
El programa en programas/Java/ejemplojava.java realiza unaordenacion con dos hilos.Trabajar con el:
Compilarlo con javac.
Entender su funcionamiento.
Explicar el trabajo con hilos: run , start y isAlive .
Explicar los tiempos de ejecucion que se obtienen.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Se usa la librerıa pthreads.h
Se declara un array de hilos:pthread t threads[NUM THREADS]
Los hilos se ponen en marcha conpthread create
que recibe la direccion del hilo (&threads[i]), la direccion dememoria de la funcion que ejecuta el hilo, y la direccion de laestructura que contiene los parametros que se pasan a lafuncion ((void *) &thread data array[i])
Se espera a que acaben los hilos conpthread join(threads[i], &status)
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: ordenacion con varios hilos
El programa en programas/Pthreads/ejemplopthreads.cpprealiza una ordenacion con varios hilos.Trabajar con el:
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Se usa la librerıa omp.h
Hay funciones para establecer el numero de hilos a poner enmarcha en una region paralela (omp set num threads) ypara que cada hilo obtenga su numero dentro de una regionparalela (omp get thread num)
Los hilos se ponen en marcha con#pragma omp parallel
Todos los hilos (incluido el maestro) ejecutan el mismo codigodentro de la region paralela, pero cada hilo hace cosasdistintas utilizando su identificador.
Los hilos se sincronizan al acabar la region paralela. A partirde ese punto sigue trabajando solo el hilo maestro.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: ordenacion con varios hilos
El programa enprogramas/OpenMP/ejemploOMPordenacion.cpp realiza unaordenacion con varios hilos.Trabajar con el:
Compilarlo cong++ -O3 ejemploOMPordenacion.cpp -fopenmp.Entender su funcionamiento.Explicar el uso de las funciones de OpenMP y del constructorparallel.Variar el valor de NUM THREADS y explicar los tiempos deejecucion que se obtienen.Comparar los tiempos con los obtenidos con C, Java ypthreads.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: ordenacion por mezcla
El programa en programas/OpenMP/codigo6-15.c es del libro de Introduccion a laProgramacion Paralela, de Almeida, Gimenez, Mantas y Vidal, Paraninfo 2008(http://www.paraninfo.es/catalogo/9788497326742/introduccion-a-la-programacion-paralela).Realiza una ordenacion con varios hilos con la tecnica mergesort, que es mas rapida quela utilizada hasta ahora.Trabajar con el:
Compilarlo y entender su funcionamiento.
Antes de ejecutar hay que establecer el numero de hilos que se van a usar en lasregiones paralelas con:export OMP NUM THREADS=nhilos (nhilos representa el numero de hilos)
Explicar las nuevas caracterısticas de OpenMP que aparecen en el programa.
Variar el numero de hilos y explicar los tiempos de ejecucion que se obtienen.
Comparar los tiempos con los obtenidos con el programa de ordenacion anterior.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: multiplicacion de matrices
El paralelismo en OpenMP se consigue muchas vecesdistribuyendo entre varios hilos el trabajo de un bucle.El programa en programas/OpenMP/codigo6-6.c (del librode IPP) muestra una multiplicacion de matrices entre varioshilos.Se ejecuta pasando como argumentos al programa trestamanos, el primero es el de la primera multiplicacion arealizar, el tercero el incremento de tamano y el segundo eltamano maximo.Compilarlo y entender su funcionamiento.Analizar la estructura del constructor parallel forVariar el numero de hilos y analizar los tiempos de ejecucionque se obtienen.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Problemas en el Concurso de Programacion Paralela
El Concurso de Programacion Paralela se celebra desde hace cuatro anos,y consiste en realizar programas paralelos a partir de solucionessecuenciales.
En la pagina del concurso (luna.inf.um.es) se ha creado una pruebapara practicar con los ejemplos de OpenMP, MPI y CUDA de estapresentacion.Se entra al concurso desde Mooshak, seleccionando el PP FP2014.Cada alumno tiene la misma cuenta en todos los concursos (se mandarapor correo a traves del aula virtual).
Se puede practicar con los ejemplos de OpenMP (problemas A y B), MPI(C y D) y CUDA (E y F) de ordenacion (A, C y E) y multiplicacion dematrices (B, D y F).
La explicacion de como trabajar se da en un fichero al que se accededesde cada uno de los problemas de la prueba.
Ademas de estos problemas de ejemplo se pueden consultar los deediciones pasadas y sus records en la pagina del concurso.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Se usa la librerıa mpi.h
Es un programa C con llamadas a la librerıa MPI.
Las funciones empiezan con MPI .... Hay funciones de:
inicializacion (MPI Init) y finalizacion (MPI Finalize),para obtener el numero de procesos (MPI Comm size) y elidentificador de proceso (MPI Comm rank),de sincronizacion (MPI Barrier),de envıo (MPI Send) y recepcion (MPI Recv)y otras...
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: ordenacion por mezcla con varios procesos
El programa en programas/MPI/codigo6-16.c (del libro IPP) realiza unaordenacion con varios procesos.Trabajar con el:
Compilarlo (hay que tener instalado algun MPI, como openmpi, mpich...)conmpicc -O3 codigo6-16.c
Se ejecuta conmpirun -np X ./a.out tam
donde X indica el numero de procesos a usar, y tam el numero de datos aordenar.
Entender su funcionamiento.
Explicar el uso de las funciones de MPI.
Variar el numero de procesos y explicar los tiempos de ejecucion que seobtienen.
Comparar los tiempos con los obtenidos con OpenMP.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: multiplicacion de matrices
El programa en programas/MPI/codigo6-10.c (del libro de IPP)muestra una multiplicacion de matrices con varios procesos.
Se ejecuta pasando como argumento el tamano de las matrices amultiplicar.
Ademas de las funciones anteriores utiliza la funcion MPI Bcast,para mandar datos de un proceso a todos los demas.
Compilarlo, ejecutarlo y entender su funcionamiento.
Variar el numero de procesos y analizar los tiempos de ejecucionque se obtienen.
Para los ejemplos de MPI se pueden utilizar los problemascorrespondientes de la prueba PP FP2014 del concurso de programacionparalela.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Se pueden encontrar ejemplos de programas en CUDA enNVIDIA GPU Computing SDK.Ahı hay, entre otros, ejemplos de ordenacion y multiplicacionde matrices.
La programacion de GPUs es mas compleja que la vistahasta ahora con OpenMP y MPI, por lo que veremos un parde ejemplos simplificados que incluyen ordenacion ymultiplicacion de matrices pero que son ligeramente distintosde los vistos hasta ahora.
Utilizamos ejemplos que estan en la lista de records delConcurso de Programacion Paralela, y se puede usar laprueba PP FP2014 para experimentar con ellos.
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: ordenacion en CUDA
El programa en programas/CUDA/ordenacionCUDA.cu corresponde alproblema B del concurso de programacion paralela de 2012.El problema consiste en ordenar los datos de cada una de las filas deuna matriz y a continuacion los datos en cada una de las columnas.La solucion utiliza un metodo de ordenacion llamado radixsort.Trabajar con el:
Mandarlo al concurso PP FP2014 y comprobar su funcionamiento.
Identificar en el las funciones de CUDA (empiezan por cuda) y sufuncionamiento.
Identificar como se lanzan ejecuciones a la tarjeta grafica.
Analizar su tiempo de ejecucion viendo como varıa al variar eltamano de bloque, y comparar con soluciones que no utilizanCUDA (hay soluciones OpenMP y MPI+OpenMP en la tabla derecords del concurso).
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
Ejemplo: multiplicacion de matrices
El programa en programas/CUDA/multiplicacionCUDA.cu corresponde alproblema D del concurso de programacion paralela de 2011.El problema consiste en multiplicar cuatro matrices.Se van multiplicando dos a dos, por lo que el paralelismo se encuentra en lamultiplicacion de dos matrices.Cada hilo CUDA multiplica una fila de una matriz por una columna de otra. Losnumeros de fila y columna se obtienen en funcion de los identificadores del hiloCUDA.Trabajar con el:
Mandarlo al concurso PP FP2014 y comprobar su funcionamiento.
Analizar su tiempo de ejecucion viendo como varıa al variar losThreadsPerBlock.
Comparar con soluciones que no utilizan CUDA (hay soluciones OpenMP yMPI+OpenMP en la tabla de records del concurso).
Paradigmas de Programacion ParalelaEntornos de Programacion Paralela
Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA
... y para la proxima sesion
Ir pensando temas alternativos para presentaciones deldıa 6 de noviembre. Hay una lista de posibles temas en elfichero de practicas. Hay que mandar al profesor un correoproponiendo un tema.
Se vera programaci on en memoria compartida , conOpenMP . Consultar la parte correspondiente del capıtulo 3del libro de IPP.
Tras la sesion de teorıa se trabajara en practicas con elproblema A del concurso de programacion paralela de 2014.
La primera practica tiene una parte de trabajo con losproblemas A y B del concurso de programacion paralela de2014. La entrega es el 30 de noviembre.