VAIZDŲ KLASIFIKAVIMAS PAGAL SUSPAUDIMO ALGORITMO POVEIKĮ JŲ KOKYBEI Jevgenij Tichonov Olga Kurasova Ernestas Filatovas Kompiuterininkų dienos 2015
Jan 17, 2017
VAIZDŲ KLASIFIKAVIMAS PAGAL SUSPAUDIMO ALGORITMO POVEIKĮ JŲ KOKYBEI
Jevgenij TichonovOlga KurasovaErnestas Filatovas
Kompiuterininkų dienos 2015
o Darbe nagrinėjamas vaizdų klasifikavimo uždavinys, kuriuo siekiama klasifikuoti vaizdus pagal suspaudimo algoritmo poveikį jų kokybei.
2
TEMA
o Šiuo metu vaizdų saugojimo klausimas yra sprendžiamas duomenis perkeliant į nutolusius serverius, o duomenų kiekis mažinamas, vaizdus apdorojant universaliais algoritmais, tokiais kaip JPEG ar panašiais.
o Dažniausiai labai svarbu būna išlaikyti originalaus vaizdo dydį bei raišką, ir visais atvejais yra svarbu išlaikyti ko geresnę kokybę, sunaudojant ko mažiau užimamos vietos.
3
VAIZDŲ SAUGOJIMAS
o JPEG formatas yra labiausiai paplitęs vaizdų saugojimo formatas, pripažintas standartu.
o Galima varijuoti tarp daugelio JPEG algoritmo parametrų, parenkant geriausiai tinkančius konkrečiam vaizdui.
o Net esant vienodoms parametrų reikšmėms, priklausomai nuo vaizdo turinio, gaunami skirtingos kokybės ir dydžio vaizdai
o Iš anksto nustatyti, kaip JPEG algoritmo parametrų reikšmės paveiks tam tikrą vaizdą yra sudėtinga.
4
JPEG
5
VAIZDŲ VALDYMO MODELIO PROCESAS
6
o Subjektyvaus tyrimo metodo esmė – suspausto vaizdo kokybės vertinimo vidutinė ekspertų grupės nuomonė apie jo kokybę (MOS, Mean Opinion Score).
o Dažniausiai naudojamas metodas yra – PSNR (Peak Signal-to-Noise Ratio), kurio pagrindas – vidutinio kvadratinio nuokrypio (MSE, Mean Square Error) vertinimas.
o Didelė PSNR reikšmė ne visada garantuoja gerą vaizdo kokybę.
VAIZDŲ KOKYBĖ
7
o Per pastarąjį dešimtmetį buvo sukurti sudėtingesni ir tikslesni metodai, vienas iš jų – Struktūrinio panašumo (SSIM, The Structural Similarity) indekso metodas.
o Jo matematinis modelis yra sudėtingas, tačiau pelnytai laikoma, kad metodu gaunamas rodiklis geriau atspindi žmogaus matomo vaizdo suvokimo ypatybes.
VAIZDŲ KOKYBĖ
TURKEY1 TURKEY2
TURKEY3 TURKEY4
8
PIMOJO EKSPERIMENTINIO TYRIMO SĄLYGOS
o Vaizdų apdorojimui yra naudojama „Spencer Kimball & Peter Mattis“ JPEG suspaudimo procedūrą (atviro kodo programa GIMP 2.6.11).
o Vaizdai keičiami parenkant skirtingas kokybės skalės reikšmes (JPEG kokybės skalė nuo 1 iki 100).
o Pirmuoju atveju visi vaizdai yra suspaudžiami nustatant kokybės skalės reikšmę – 90, antruoju – 75, trečiuoju– 50.
o Gautų vaizdų kokybė vertinama, lyginant pradinius bei apdorotus vaizdus SSIM indekso metodu
o Kokybė išreikšta ne struktūrinio panašumo (SSIM) indeksu, o struktūrinio skirtumo (ISSIM) indeksu procentais, kur .
9
PIMOJO EKSPERIMENTINIO TYRIMO SĄLYGOS
Pradinis vaizdas(failo dydis MB)
Kokybės skalės reikšmė 90
(failo dydis MB)
Kokybės skalės reikšmė 75
(failo dydis MB)
Kokybės skalės reikšmė 50
(failo dydis MB)
TURKEY1 4,2 1,7 1,0 0,7TURKEY2 4,4 1,9 1,1 0,7TURKEY3 4,3 1,7 1,0 0,7TURKEY4 4,4 1,9 1,1 0,8
Pradinis vaizdasISSIM indeksas
(MSE)
Kokybės skalės reikšmė 90
ISSIM indeksas (MSE)
Kokybės skalės reikšmė 75
ISSIM indeksas (MSE)
Kokybės skalės reikšmė 50
ISSIM indeksas (MSE)
TURKEY1 0 (0) 0,5 (2,5) 1,0 (5,0) 1,7 (8,9)TURKEY2 0 (0) 1,0 (3,3) 1,9 (6,6) 3,1 (11,8)TURKEY3 0 (0) 1,1 (3,6) 1,9 (7,3) 2,8 (12,6)TURKEY4 0 (0) 0,5 (2,7) 0,8 (5,2) 1,5 (9,3)
10
PIMOJO EKSPERIMENTINIO TYRIMO REZULTATAI
11
ANTRASIS EKSPERIMENTINIS TYRIMAS
o Eksperimentinio tyrimo metu siekiama nustatyti, kokie originalius vaizdus apibūdinantys požymiai turi būti naudojami klasifikuojant šiuos vaizdus pagal jų kokybę po suspaudimo JPEG algoritmu.
12
ANTROJO EKSPERIMENTINIO TYRIMO SĄLYGOS
o Eksperimentiniam tyrimui panaudota SUN2012 skaitmeninių vaizdų duomenų bazė (16 873 vaizdų)
o Atsitiktinai atrinkti 400 vaizdų (ne mažesni nei 1024×768 taškų)
o Vaizdai suspaudžiami JPEG algoritmu ir apskaičiuota suspaustų vaizdų kokybė naudojant SSIM indekso metodą
o Gautos SSIM reikšmės svyruoja nuo 0,816 (kokybė nukentėjo labiausiai) iki 0,977 (kokybė nukentėjo mažiausiai)
13
ANTROJO EKSPERIMENTINIO TYRIMO SĄLYGOS
o Sudarytos dvi klasės:
į pirmą klasę atrinkti 60 vaizdų, kurių kokybė pakito mažiausiai (SSIM reikšmės svyruoja nuo 0,955 iki 0,977),
į antrą klasę atrinkti 60 vaizdų, kurių kokybė pakito daugiausiai (SSIM reikšmės svyruoja nuo 0,816 iki 0,9). o Vaizdų klasifikavimui naudojamas atraminių vektorių
klasifikatorius su Gausine branduolio funkcija.
o Klasifikavimo tikslumas vertinamas atliekant kryžminį patikrinimą, kai mokymo imtis dalinama į dalių.
14
VAIZDŲ KLASIFIKAVIMAS NENURODANT SPECIFINIŲ POŽYMIŲ
o Mokymo imties vaizdų matmenys sumažinami iki 256×192 taškų.
o Gautų vaizdų trimačiai RGB reikšmių masyvai yra užrašomi vektoriais:
o Visi vektoriai užrašomi dvimatį masyvą, nurodant kiekvieno objekto klasę.
o Atliekamas klasifikatoriaus mokymas bei kryžminio patikrinimo metu nustatomas klasifikavimo tikslumas.
o Šio eksperimento metu gautas tikslumas tesiekia 51 %.
15
VAIZDŲ KLASIFIKAVIMAS PAGAL SSIM ŽEMĖLAPIUS
1 klasė 2 klasė
SSIM Maps
Gautas 97,5 %
klasifikavimo tikslumas
16
VAIZDŲ KLASIFIKAVIMAS TAIKANT KRAŠTŲ APTIKIMO FILTRUS
o JPEG algoritmas mažina tarpinių spalvų skaičių bei keičia vaizdo struktūrą.
o Prielaida - panaudojus kraštų aptikimo (angl. Edge Detection) filtrą originaliam vaizdui, galima išryškinti tas vietas, kurias JPEG algoritmas labiausiai paveiks mažindamas tarpinių spalvų skaičių ir keisdamas struktūrą.
o Pirmiausiai mokymo imties vaizdai yra apdorojami Sobelio kraštų aptikimo filtru. Gautas klasifikavimo tikslumas 72,5 %.
17
VAIZDŲ KLASIFIKAVIMAS TAIKANT KRAŠTŲ APTIKIMO FILTRUS
o Vaizdus apdorojus Laplaso kraštų aptikimo filtru, gautas klasifikavimo tikslumas siekia 82,3 %.
o Vaizdų, apdorotų Laplaso kraštų aptikimo filtru, fragmentai:
1 klasė 2 klasė
18
IŠVADOS
Klasifikavimo tikslumas, %
RGB reikšmės 51,0SSIM žemėlapiai 97,5Taikant Sobelio kraštų aptikimo filtrą 72,5Taikant Laplaso kraštų aptikimo filtrą 82,3
o Apmokius klasifikatorių SSIM indekso žemėlapių, sudarytų lyginant originalius ir suspaustus vaizdus, duomenimis, gautas labai aukštas klasifikavimo tikslumas (virš 97 %).
o Atsižvelgiant į tai, kad vaizdus priskirti klasėms reikia dar prieš suspaudimą, o tokių vaizdų SSIM indekso žemėlapiai dar nėra žinomi, todėl šis klasifikuojamų duomenų sudarymo būdas nėra tinkamas. Tačiau šis tyrimas parodė, kad siekiant gauti aukštą originalių vaizdų klasifikavimo tikslumą, reikia iš originalių vaizdų gauti SSIM indekso žemėlapių analogus.
19
Ačiū už dėmesį!