Top Banner
EPUSP - Guido Stolfi 1 / 43 LCS EPUSP Compressão de Áudio MPEG AAC PTC3547 Codificação e Transmissão Multimídia Guido Stolfi EPUSP - 2019
43

Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

Aug 13, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 1 / 43

LCSEP US P

Compressão de Áudio MPEG AAC

PTC3547 – Codificação e

Transmissão Multimídia

Guido Stolfi

EPUSP - 2019

Page 2: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 2 / 43

LCSEP US PTópicos Abordados

• MPEG-2 AAC – Advanced Audio Coding– Blocos Funcionais

• MPEG-4 AAC – Ferramentas Adicionais– SBR, CELP, HVXC, etc.

– Conceitos Chave

– Requisitos Computacionais

• Síntese Musical

• MIDI – Musical Instruments Digital Interface

Page 3: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 3 / 43

LCSEP US PMPEG-2 AAC (Advanced Audio Coding)

• Derivado do MPEG-2 Nível III

• 1 a 48 canais de áudio

• 8 a 96 kHz de amostragem

• Patentes: AT&T, Sony, Dolby, Fraunhofer

• Usado no sistema ISDB, XM Radio e DRM– Low Complexity AAC (AAC-LC)

– High Efficiency (HE-AAC ou “AACPlus”

– Scalable Sample Rate (AAC-SSR)

– Bit Sliced Arithmetic Coding (BSAC)

Page 4: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 4 / 43

LCSEP US PDiferenças do AAC x MPEG-2

• Banco de filtros implementado por DCT modificada, 1024 pontos (Processamento T / F)

• Não é compatível com MPEG-1

• Utiliza preditor linear para pré-codificação

• Efetua “Noise Shaping” adaptativo

• Pode utilizar replicação espectral (SBR)

• Otimização da codificação estatística dos símbolos transmitidos

– Resultado: redução de 50% na taxa de bits

Page 5: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 5 / 43

LCSEP US PDiagrama de Blocos da Codificação AAC

Page 6: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 6 / 43

LCSEP US PControle de Ganho

LP

HP

LP

HP

LP

HP

Controle de Ganho

(0-24 kHz)

(0-6 kHz)

(6-12 kHz)

(12-18 kHz)

(18-24 kHz)

(Coeficientes)

Page 7: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 7 / 43

LCSEP US PBanco de Filtros: DCT com Janela Temporal

DCT2048256

(1024 / 128 Coeficientes)

Janela Longa / Curta

Page 8: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 8 / 43

LCSEP US PJanelas Temporais Superpostas

1 Frame (1024 Amostras)

DCT Longa (2048 Amostras)

8 DCTs Curtas (256 Amostras)

DCT Transição(2048 Amostras)

DCT Transição(2048 Amostras)

Janelas Longas

Janelas Curtas

Page 9: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 9 / 43

LCSEP US PCodificador com Preditor

Preditor Preditor

y(t)

y(t)^ y(t)^

y(t)e(t)+

-

Transmissor Receptor

Canal

S1 S2

•Eficácia do preditor reduz a energia do sinal transmitido e(t)

•Chaves S1 e S2 devem ser abertas em instantes apropriados

Page 10: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 10 / 43

LCSEP US PPreditor Espectral

Espectro deEntrada

Espectro QuantizadoDo Frame Anterior

Erro Espectral

Filtro de 2a Ordem

Filtro de 2a Ordem

Filtro de 2a Ordem

CoeficientesEspectrais

P/ Quantizador

Page 11: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 11 / 43

LCSEP US PNoise Shaping

Q

Sinal

Ruído deQuantização

Quantizador

Q

Sinal

Ruído deQuantização

Quantizador

F F-1

Equalizador(Pré-ênfase)

De-ênfase

Page 12: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 12 / 43

LCSEP US PTNS – Temporal Noise Shaping

F

Espectro doSinal

Filtro no DomínioDa Frequência

EnvoltóriaEspectral Filtrada

1/x

Equalização(Pré-ênfase)

Q

Quantizador

Sinal com“Noise Shaping”

Forma do “Noise Shaping” éVariável no Tempo

Page 13: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 13 / 43

LCSEP US PQuantizador Não Linear

QX0,75 X1,333

Fator de Escala(Frame / Frequência)

CoeficienteEspectral

CoeficienteQuantizado

(Restauração noDecodificador)

Quantizador(Frame / Frequência)

Page 14: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 14 / 43

LCSEP US PQuantizador Não Linear

s(x)

s(x)0,75

Page 15: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 15 / 43

LCSEP US PCompactação dos Coeficientes

• Fatores de Escala:

– Codificação Diferencial em relação ao Frame anterior

– Resolução de 1,5 dB

• Quantizador:

– Selecionado com resolução de 1,5 dB

• Fator de Escala + Quantizador:

– Codificado como um símbolo conjunto

– Vários dicionários (Huffmann) selecionáveis para codificação

• Coeficientes Quantizados:

– Agrupados (2 ou 4) e codificados com um de 11 dicionários, válidos por faixas de frequência.

Page 16: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 16 / 43

LCSEP US P

MPEG-4 AAC

Ferramentas Adicionais

Page 17: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 17 / 43

LCSEP US PMPEG-4 – Ferramentas de Codificação

• Codificação de Áudio Natural:– MPEG-2 AAC

– SBR: Spectral Band Replication

– CELP: Code Excited Linear Prediction

• Codificação paramétrica:– HVXC: Harmonic Vector Excitation Coding

– HILN: Harmonic, Individual Line + Noise

• Áudio Sintético:– M-TTS: MPEG Text To Speech

– SAOL: Structured Audio Orchestra Language

– SASL: Structured Audio Score Language

– SASBF: Structured Audio Sample Bank Format

– MIDI: Musical Instruments Digital Interface

Page 18: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 18 / 43

LCSEP US PCodificação MPEG-4 para TV Digital Brasileira

• Norma ABNT NBR 15602-2

• Codificação MPEG-4 AAC (ISO/IEC 14496-3):

– LC (Perfil básico Low Complexity), níveis L2 e L4;

– HE (High Efficiency, LC + SBR), níveis L2 e L4;

– HE + PS (Parametric Stereo), nível L2.

Page 19: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 19 / 43

LCSEP US PSBR (Spectral Band Replication)

Page 20: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 20 / 43

LCSEP US PDecodificação SBR (Spectral Band Replication)

Page 21: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 21 / 43

LCSEP US PMPEG-4 AAC – Decodificador Paramétrico

• HVXC – Harmonic Vector Excitation Coding– Codificação de Voz, 1.2 a 4 kb/s

– Amostragem: 8 kHz

– Processamento: Frames de 20 ms (160 amostras)

• HILN – Harmonic and Individual Line + Noise– Voz e música, > 4 kb/s

– Usa PNS (Perceptual Noise Substitution)

Page 22: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 22 / 43

LCSEP US PMPEG-4 AAC – Decodificador Paramétrico

Modo de Codificação:PARAmode = 0 HVXC

1 HILN2 Comutado HVXC / HILN (fading 20 ms)3 Combinado HVXC / HILN

Page 23: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 23 / 43

LCSEP US PDecodificador HVXC

• Sinais Vocálicos:– Quantização Vetorial da envoltória espectral dos resíduos da

codificação LPC (VQ)

• Sinais Não Vocálicos:– Codificação por Excitação Vetorial (VXC)

Page 24: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 24 / 43

LCSEP US PConceitos Básicos

• Vocoder

• LPC (Linear Predictive Coding)

• Quantização Vetorial (VQ)

• Decodificação Excitada por Código

• Síntese harmônica

• PNS (Perceptual Noise Substitution)

Page 25: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 25 / 43

LCSEP US PSíntese Básica de Voz (Vocoder)

frequência

ganho

ruído

formantesvogais /consoantes

Page 26: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 26 / 43

LCSEP US PSíntese por LPC (Linear Predictive Coding)

Preditor Preditor

y(n)

y(n)^ y(n)^

y(n)e(n)+

-

(Filtro Linear)

Receptor

Canal

S1 S2

Transmissor

LMS

Algoritmo de Ajuste do Filtro

Preditor

Coeficientes doFiltro

)(...)2()1()(ˆ 21 Mnybnybnybny M

Exemplo de Filtro FIR:

Page 27: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 27 / 43

LCSEP US PQuantização Vetorial

• Conjunto N-dimensional de valores de entrada é quantizado como um vetor (de N dimensões), escolhido entre um conjunto de M vetores possíveis, de acordo com um critério de “mínima distância”;

• A lista dos M vetores possíveis é o “dicionário de vetores” (codebook);

• O conjunto de valores de entrada é convertido em um número m(índice) que identifica o vetor quantizado dentro da lista.

Page 28: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 28 / 43

LCSEP US PQuantização Vetorial

1

2

3

.

.

.

M

Ganho

Índice m

Sinal de Entrada

2x

VQ(m)

EQ(m)

Vetor quantizado é dado pelo índice m para o qual foi obtido o menor erro de quantização EQ(m).

Page 29: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 29 / 43

LCSEP US PDecodificação Excitada por Código

1

2

3

.

.

.

M

FiltroLPC

Ganho

Índice

Resíduo (erro de predição)

Coeficientes LPC

Saída

Vetor de Excitação

Page 30: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 30 / 43

LCSEP US PSíntese Harmônica

1

2

3

.

.

.

M

Ganho

Índice

Frequência

Interpolador

Resíduo

PreditorLPC

Coeficientes LPC

EnvoltóriaEspectral

EnvoltóriaEspectral

Interpolada

Espectro de Saída

Page 31: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 31 / 43

LCSEP US PPNS (Perceptual Noise Substitution)

1

2

3

.

.

.

M

Ganho

Índice

RuídoBranco

Interpolador

Componentes harmônicas

EnvoltóriaEspectral

EnvoltóriaEspectral

Interpolada

Ruídoperceptual

Espectro composto

Page 32: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 32 / 43

LCSEP US PModos de Operação MPEG-4 CELP

• Taxa de Amostragem de 8 kHz:– Quantizador Vetorial

– Taxas de Bits de 3850 a 12200 bps

• Taxa de Amostragem de 16 kHz:– Quantizador Escalar

– Taxas de Bits continuamente variáveis de 13667 a 20133 bps e de 21800 a 24000 bps

Page 33: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 33 / 43

LCSEP US P

Ferramentas Específicas do Decodificador CELP MPEG-4

Page 34: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 34 / 43

LCSEP US PRequisitos Computacionais Típicos (MPEG-4)

fA (kHz) MOPS kWords

AAC Principal 48 5 5

AAC-LC 48 3 3

AAC-SSR 48 4 3

LTP 48 4 4

AAC Escalável 48 5 4

VQ Duplo 24 2 3

CELP 8 1 1

CELP 16 2 1

CELP 8/16 3 1

HVXC 8 2 1

Page 35: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 35 / 43

LCSEP US PÁudio Sintético

• Síntese Musical– SAOL: Structured Audio Orchestra Language

– SASL: Structured Audio Score Language

– SASBF: Structured Audio Sample Bank Format

– MIDI: Musical Instruments Digital Interface

• Síntese de Fala– TTS (Text To Speech)

Page 36: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 36 / 43

LCSEP US PModelo de Síntese Musical

Page 37: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 37 / 43

LCSEP US PElementos da Sintaxe SASBF

• Geradores de:– Índice: apontam para outra estrutura de dados

– Range: indicam uma faixa de valores onde um parâmetro (nota, intensidade) é definido

– Substituição: atribuem um valor numérico a um evento

– Amostra: afetam as propriedades de um som amostrado

– Valor: afetam diretamente parâmetros do som sintetizado.

Page 38: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 38 / 43

LCSEP US PGerador de Amostra

StartStartLoop

EndLoop

End

SampleID

PITCH: Afeta frequência de amostragem,após modificado por Vibrato, Modulação etc.

Page 39: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 39 / 43

LCSEP US PSintaxe MIDI (Musical Instruments Digital Interface)

• Canal MIDI: 1 a 16 – identifica módulo que deve receber o comando.

• Note ON: identifica o Canal MIDI, a nota musical (0 a 127) e a velocidade de acionamento (1 a 127, associada geralmente à intensidade).

• Note OFF: idem, com velocidade de “desacionamento”.

• Controlador: CC 0 a 127: atribui valores contínuos (14 bits) a parâmetros pré-determinados (volume, pitch bend, filtro, etc.)

• Program Change: seleciona configuração pré-programada para conjunto de parâmetros de síntese (ex. General Midi estabelece lista de instrumentos padronizados).

Page 40: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 40 / 43

LCSEP US PSintaxe MIDI (Musical instruments Digital Interface)

• Aftertouch: parâmetro que afeta uma nota de um dado canal, após o evento Note ON (p. ex, alterando a modulação ou intensidade).

• System Exclusive: Informação específica para um determinado equipamento (p. ex., programação de parâmetros).

• Standard Midi File (SMF): sequência de comandos MIDI com informaçoes de temporização relativa entre os comandos

Page 41: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 41 / 43

LCSEP US PMensagem MIDI

1 0 0 0 n n n n

“Note ON” Canal = n+1

0 k k k k kkk

Nota k (64 = Dó Central)

0 v vv vv vv

Velocidade (0 = Note OFF)

Comando / Dado

Page 42: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 42 / 43

LCSEP US PCodificador MPEG-4 TTS (Text To Speech)

Page 43: Compressão de Áudio MPEG AACgstolfi/PPT/Audio_AAC.pdf · EPUSP - Guido Stolfi 3 / 43 LCS MPEG-2 AAC (Advanced Audio Coding) EPUSP•Derivado do MPEG-2 Nível III •1 a 48 canais

EPUSP - Guido Stolfi 43 / 43

LCSEP US PAplicação do Codificador TTS

Sintetizador de Voz

Sintetizador Facial

ControladorDMUX

Base de Dados(Histórias)

“Contador de Histórias”sob demanda