OASDSP2: Osnovi kompresije audio signala Novi Sad, 2019 strana 1 • Osnovni principi kompresije audio signala • Kompakcija energije – spektralni domen • Kvantizacija spektralnih koeficijenata • Statističko kodovanje – Huffmann algoritam • Primer aloritma za kompresiju audio signala – MP3
20
Embed
Osnovni principi kompresije audio signala Kompakcija ... 3-4...•Statističko kodovanje ... Kompresijom digitalnog signala smanjuje se broj bita potreban za predstavljanje signala.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 1
• Osnovni principi kompresije audio signala
• Kompakcija energije – spektralni domen
• Kvantizacija spektralnih koeficijenata
• Statističko kodovanje – Huffmann algoritam
• Primer aloritma za kompresiju audio signala – MP3
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 2
Primeri kompresije
Crno-bela slika dimenzija 512x512 pixela, 8 bita po pixelu
Potrebno 512 x 512 x 8 = 2097152 bita
Govor 10 sekundi, 8 kHz mono
Potrebno 10 x 8000 x 8 = 640000 bita
Rukopis
Potrebno 528 x 36 = 19008 bita
crno-bela fotografija devojke zagonetnog osmeha
Tekst 47 karaktera
Potrebno 47 x 8 = 376 bita
Lenna
Cilj – predstaviti pojavu iz realnog sveta u digitalnom svetu
Problem – broj bita potreban za „verno“ predstavljanje pojave
e) IMDCT koeficijenti signala pod d), alias je obeležen markerima na grafiku
f) Rekonstruisani signal u vremenskom domenu nastao korišćenjem “preklopi i saberi” procedure.Originalni signal u preklopljenom delu (između tačaka B i C) je perfektno rekonstruisan
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 8
Sinusna i KBD prozorska funkcija Karakteristike sinusne i KBD prozorske funkcije
Kompakcija energije - Primeri prozorskih funkcija
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 9
Kompakcija energije - Primer
Primer: sinusni signal
• učestanost odabiranja 1
• dužina prozora 1024 odbirka
• spektralna rezolucija: 512 različitih učestanosti
• amplitudno kvantovanje: 16 bita
• broj mogućih faza: 1024
Ukupan sadržaj signala:
= 1024 x 16 = 16384 bita
Model
Odbirci u vremenu
IFFT
parametri
{ f, q, a }
Kernel: parametri
9 + 9 + 16 = 34 bita
Redundansa i Irelevansa:
16384 – 34 = 16350 bita
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 10
Kvantizacija spektralnih koeficijenata
Transformaciono kodovanje
• dekorelacija signala pomoću spektralne dekompozicije (banke filtera)
• kvantizacija i alokacija bita na transformacione koeficijente (podopsege)
HN-1 $N
H1 $N
H0 $N
x(nN+k)
y(nN+0)
hN
hN
hN
GN-1
G1
G0
+
y(nN+1)
y(nN+N-1)
r(nN+k)
Q0
Q1
QN-1
BN-1
B1
B0
1
0
N
n
nBBN
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 11
Generalni model
• uslov perfektne rekonstrukcije u analizi sintezi
• maksimalna dekorelacija u analizi
• optimalna alokacija bita kod kvantovanja
0
Analiza
dekorelacija
Sinteza
perfektna
rekonstrukcija
Qn
N-1
signal
s(k)rekonstrukcija
r(k)
podopseg n
snqn
1
0
222222 ,
)()(
1,...,0:
N
n
nnn
nn
ss
ksdkrsq
NnpodopsegaN
2
21
0
2,
2
2222, 2
:
q
N
n
nqq
Bnnnq
nnnn
SNR
c
sqbitaB
n
Signali u podopsezima Šum kvantizacije u podopsezima
1
0
1 N
n
nBN
B
Broj bita po ulaznom odbirku
Kvantizacija spektralnih koeficijenata
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 12
Optimizacija: Rasporediti raspoložive bite {Bn; n=0,...,N-1} na podopsege tako da je:
• ukupan broj bita konstantan
• da je ukupna snaga kvantizacionog šuma minimalna
• referenca je direktno kvantovanje ulaznih odbiraka (B bita):
1
0
1 N
n
nBN
B
1
0
22 2minN
n
Bn
nc
2
2
11
0
2
2
0
2
1
2
1
1,...,1,0
n
n
NN
n
n
NldGldBB
N
G
SNRGSNR
Nn
B
cSNR
20 2
1
SNR
[dB]
G [dB]
obična
digitalizacijametoda
kompresije
Bit / odbirak
G / 6
Kvantizacija sp. keof. - Kontrola raspodele bita
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 13
a) originalni signal
b) N=1024
c) N=256
Kvantizacija sp. keof. – Izobličenje pre-eho
• Inverzna transformacija ravnomerno širi kvantizacionu grešku
• Adaptivne TDAC filter banke – promenljiva dužina bloka
• Dugački blokovi za kratkotrajno stacionarne signale (npr. čembalo)
• Kratki blokovi za brzo promjenljive signale (npr. kastanjete)
• Izbor između dugačkih blokova (velika frekventna razlučivost) i kratkih blokova (velika vremenska razlučivost)
• Šta se dešava sa stepenom kompresije?
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 14
Kvantizacija sp. keof. – Poređenje transformacija
Blok transformacije• jednostavna realizacija
(brzi algoritmi)
• blocking effect je problem
Transformacije
sa preklapanjem• složenija obrada
(pre/post processing)
• nemaju blocking effect
• pre-eho je problem
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 15
Statističko kodovanje - Huffmann algoritam
Entropijsko kodovanje (Huffmann)
kompresija u statističkom smislu
promenjiva dužina reči koda
N
n
nn
n
ppeVerovatnoć
NnSSimboli
1
1:
,...,1:
Sortirati simbole po opadajućim verovatnoćama:
WLengthLwwpw
Nssl
lwlwW
nnsk
kkn
NN
k
11
11
),...,1(
,,......,,
Stopiti dva poslednja u listi
1111
1111
11
1
111
111
,
1,...,1
nL
nL
nL
nL
nL
nL
nnk
nk
nk
nk
nnn
nnn
lll
www
Lkll
ww
Sortirati simbole po opadajućim verovatnoćama:
Wn Ln = Ln-1 -1
Kodovanje:
• Dodeliti svakoj od dve pod-grupe 0 i 1
• postupak ponavljati do poslednjeg simbola
• Svaki simbol dobija po jednu reč promenjive dužine
• Dekodovanje: pomoću poznate raspodele bita (bit-tree)
Algoritam za kodovanje
OASDSP2: Osnovi kompresije audio signala
Novi Sad, 2019 strana 16
Statističko kodovanje - Primer
Primer 2: Potrebno je kodovati Huffmann algoritmom sledeću sekvencu simbola: