AJProença, Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10 1 Sistemas de Computação e Desempenho Mestrado em Informática 2009/10 A.J.Proença Tema Revisitando os Sistemas de Computação (2) AJProença, Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10 2 Chapter 1 — Computer Abstractions and Technology — 2 Understanding Performance • Algorithm – Determines number of operations executed • Programming language, compiler, architecture – Determine number of machine instructions executed per operation • Processor and memory system – Determine how fast instructions are executed • I/O system (including OS) – Determines how fast I/O operations are executed AJProença, Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10 3 Análise do desempenho em Sistemas de Computação: oportunidades para optimizar na arquitectura Optimização do desempenho (no CPU) – com introdução de paralelismo • ao nível do processo (sistemas concorrentes/paralelos/distribuídos) – só fio de execução (multi -threading/ -core / -chip ...) – processo (memória partilhada/distribuída) • ao nível da instrução (I nstruction L evel P arallelism) – só nos dados (processadores vectoriais) – paralelismo desfasado (pipeline) – paralelismo "real" (VLIW, superescalar) • no acesso à memória – paralelismo desfasado (interleaving) – paralelismo "real" (maior largura do bus) – paralelismo “redundante” (hierarquia de memória) » análise de processadores da Intel AJProença, Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10 4 Paralelismo no processador Exemplo 1 Exemplo de pipeline
11
Embed
pipeline Exemplo de - gec.di.uminho.ptgec.di.uminho.pt/Discip/MInf/cpd0910/SCD/RSC_2.pdf · AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10 Algumas limitações
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
1
Sistemasde Computaçãoe Desempenho
Mestr
ado e
m Info
rmática
2009/10
A.J.Proença
Tem
a
Revis
itando o
s S
iste
mas d
e C
om
puta
ção (2)
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
2
Chapter 1 —
Computer Abstractions and Technology —
2
Understanding Perform
ance
•Algorithm
–Determines number of operations executed
•Programming language, compiler, architecture
–Determine number of machine instructions executed
per operation
•Processor and memory system
–Determine how fast instructions are executed
•I/O system (including OS)
–Determines how fast I/O operations are executed
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
3
Análise do desempenho em Sistemas de Computação:
oportunidades para optimizar na arquitectura
Optim
ização d
o d
esem
penho (no
CP
U)
–com introdução de p
ara
lelism
o
•ao nível do processo (sistemas concorrentes/paralelos/distribuídos)
–sófio de execução (multi-threading/ -core / -chip ...)
–processo (memória partilhada/distribuída)
•ao nível da instrução (InstructionLevelParallelism)
–sónos dados (processadores vectoriais)
–paralelismo desfasado (pipeline)
–paralelismo "real" (VLIW, superescalar)
•no acesso àmemória
–paralelismo desfasado (interleaving)
–paralelismo "real" (maior largura do bus)
–paralelismo “redundante”(hierarquia de memória)
»análise d
e p
rocessadore
s d
a Inte
l
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
4
Paralelismo no processador
Exemplo 1
Exem
plo
de pipeline
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
5
Paralelismo no processador
Exemplo 2
Exem
plo
de s
upere
scala
ridade (nív
el 2)
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
6
A introdução de cache
na arquitectura Intel P6
Nota: "Intel P6" éa designação comum da microarquitecturade
PentiumPro, Pentium II e Pentium III,
que serviu depois de base àCore e Nehalem
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
7
Chapter 1 —
Computer Abstractions and Technology —
7
Inside an AMD Processor
•AMD Barcelona: 4 processor cores
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
8
Inside an Intel Processor
•Intel Nehalem : 4 processor cores
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
9
A arquitectura interna
dos processadores Intel P6 (1)
Unidades
Funcionais
Integer/
Branch
FP
Add
FP
Mult/Div
Load
Store
Instruction
Cache
Data
Cache
Fetch
Control
Instruction
Decode
Addre
ss
Instr
s.
Opera
ções
Pre
vis
ão
OK
?
Data
Data
Addr.
Addr.
General
Integer
Operation Results
Retirement
Unit
Register
File
Execution Unit
Instruction Control Unit
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
10
Algumas potencialidades
do Intel P6 (1)
de
4-n
íveis
de
pipeline...
para
vári
os
nív
eis
de
pipeline...
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
11
A arquitectura interna
dos processadores Pentium 4
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
12
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
13
Percurso crítico no pipeline de instruções:
o P6 e o Pentium 4
P6
Pentium
4
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
14
Níveis de pipeline
em 3 gerações de Pentium
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
15
O pipeline no Pentium 4:
níveis 1-5
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
16
O pipeline no Pentium 4:
níveis 6-12
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
17
O pipeline no Pentium 4:
níveis 13-17
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
18
O pipeline no Pentium 4:
níveis 18-20
AJProença,Sistemas de Computação e Desempenho, MInf, UMinho, 2009/10
19
CPU features before 2006
FIG
UR
E 4
.73 R
ecord
of In
tel and S
un M
icro
pro
cessors
in term
s o
f pip
eline c
om
ple
xity, num
ber of core
s, and
pow
er. The Pentium 4 pipeline stages do not include the commit stages. If we included them, the Pentium 4 pipelines