KÉPJELLEMZŐK TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ MÓDSZER Szerző: GOGOLÁK László V. évfolyam Témavezető: Mgr. LUKITY Tibor egyetemi tanársegéd 7. Vajdasági Magyar Tudományos Diákköri Konferencia
Jan 04, 2016
KÉPJELLEMZŐK TÁVOLSÁGÁN ALAPULÓ DIGITÁLIS KÉPFELISMERŐ
MÓDSZER
Szerző: GOGOLÁK László V. évfolyam
Témavezető: Mgr. LUKITY Tibor egyetemi tanársegéd
7. Vajdasági Magyar Tudományos Diákköri Konferencia
Bevezető
• A digitális képek matematikai ábrázolása
• Egy matematikai algoritmus bemutatása amely alkalmazható digitális képek teljes pontosságú felismerésére.
• Matematikai algoritmus tesztelése híres képalkotások felismerésére.
• Az algoritmus implementálása a Matlab programcsomag környezetére.
A digitális kép
• A kép színek variációja a térben.
• A digitális kép - két dimenzióban elhelyezkedő képpontok (pixelek) halmaza által van ábrázolva
• Származás » Scannelés ( analóg kép digitalizálása)» Digitálisan létrehozott kép (digitális kamera)
Digitális kép ábrázolása
• A kép N pixel-sorból és M pixel-oszlopból áll.
• Az N és M egész számok határozzák meg a kép nagyságát.
• Az f(x,y) képfüggvény valamint az x,y koordináták értékei egyaránt diszkrét mennyiségek.
Digitális kép ábrázolása
• A külömböző matematikai műveletek elvégzéséhez a pixeleken, szükség van a képek mátrixos ábrázolására.
A Digitális kép színrendszerei
• RGB (Red, Green, Blue) színrendszer
• CMY (Cyan, Magenta, Yellow) színrendszer
• HSV (Hue, Saturation, Intensity)» Hue (színárnyalat) – Megmutatja melyik színárnyalat» Saturation (telítettség) – Színárnyalat telítettsége» Intensity (intenzitás) – A szín fényereje
A kép histogramja• A hisztogram a kép pixeleinek tónusuk
szerinti gyakoriság-eloszlását mutatja
A kép H-tagjának hisztogramja
A képfelismerés
• Előre definiált kép-adatbázis alapján, felismerni, azonosítani egy “ismeretlen” képet.
Adatbázis:
“Ismeretlen” kép azonosítása
* A sikeres felismeréshez a keresendő képnek szerepelnie
kell a kép-adatbázisban !
*
A kép vektor-képjellemző reprezentációja
Φ(A) =[ H1, H2, H3, …., H255]T .
Φ(A) az A kép vektor reprezentációja, mely a kép megfelelő képjellemzőit tartalmazza.
Esetünkben a kép H (hue - árnyalat) komponens értékeit tartalmazza,
Képfelismerő algoritmusunk 255 színárnyalatot használ.
A távolságfüggvény Az A és B képek közötti távolságfüggvény, dΦ
definíciója
ahol d valós vektortérben értelmezett távolságfüggvény. Esetünkben,
A távolságfüggvény megmutatja hogy a két kép mennyiben külömbözik egymástól.
Az algoritmus előkészítése
• A képadatbázis létrehozása» A felismerésre szánt képek formázása» Az adatbázis képek színkomponenseinek (HSI)
feldolgozása és eltárolása
• Az adatbázis 20 kép adatait tartalmazza
B = {Ai | i=1,2,3…20 }
A= [ aij] NxM
Az algoritmus
Legyen X az adott ismeretlen kép. Az X kép
megfelelője a bázisban az A* kép, ahol
Az ismeretlen kép ahhoz a képhez áll
legközelebb amelyikre a távolságfüggvény
minimum értékű lesz.
Implementálás a MATLAB programcsomagba – ADATBÁZIS
s11=imread(‘bazis1.jpg'); Kép beolvaasásahs11=RGB2HSV(s11); RGB-ből HSI-behs11_255=uint8(round(hs11(:,:,1)*255)); Az árnyalatok
skalirozása 0 és 255 értékek közéH11=imhist(hs11_255); A H komponens histogramjaH_val(1,:)= H11'; A képek H komponens histogramjának
elmentése egy változóba
A beolvasást mind a 20 képre el kell végezni, hogy megkapjuk a teljes kép-adatbázist
Implementálás a MATLAB programcsomagba – FELISMERÉSx=imread(s); Az ismeretlen kép beolvaasása
HX=RGB2HSV(x); RGB-ből HSI-be
HX_255=uint8(round(hx(:,:,1)*255)); Az árnyalatok skalirozása 0 és 255 értékek közé
Hx=imhist(hx_255); A H komponens histogramja
[m n]=size(x); Az ismeretlen kép méretének meghatározása
for i=1:20 A távolság függvény számítása
raz(i)=sum(abs(H_log(i,:)-Hx')); end
[c I]=min(raz); A legkissebb távolságfüggvény érték keresése
Az adatbázisban szereplő képek listája.
Kísérleti eredmények
Az képek felismerése 100 % pontosságú az adatbázis 20 képén tesztelve.
Leonardo Da Vinci – Az utolsó vacsora, Mona Lisa,
Vinsent Van Gogh – Önarckép, Napraforgók
Csontváry Kosztka Tivadar – Keleti Pályaudvar
Munkácsy Mihály – Honfoglalás, Poros Út, Majális, Cigánytábor
Salvador Dali – Az emlékezet állandósága, Alvás
Edvard Munch – A kiáltás
Boticelli – Vénusz születése
Velazquez – Az udvarhölgyek
John Constable – Szénásszekér
Jan Van Eyck – Az Arnolfilni házaspár
Michelangelo – Ádám születése
Még más ismeretlen szerző képei....
Befejezés
• A kifejlesztette eljárás nagy előnye az egyszerűsége ami a felismerés gyorsaságára nagymértékben kihat.
• Az eljárás nem használható minimálisan eltérő képek felismerésére.
• Nem tud felismerni olyan képet amelynek képjellemzői hiányosak az adatbázisban
• Az eljárás kiegészíthető más képjellemzők bevonásával melyek lehetővé teszik a rosszabb képminőségű képek felismerését is.
Szakirodalom
1) Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing, Second Edition, Pretince Hall, 2002.
2) Tibor Lukic, Natasa Sladoje, and Joakim Lindblad, Deterministic Defuzzication Based on Spectral Projected Gradient Optimization, Springer-Verlag, LNCS 5096, pp. 476-485, 2008.
3) Joakim Lindblad, Natasa Sladoje, and Tibor Lukic, Feature Based Defuzzification in Z2 and Z3 Using a Scale Space Approach, Springer-Verlag, Volume 4245 of LNCS, pp. 378--389, 2006.
4) Stoyan Gisbert, Takó Galina, Numerikus Módszerek 1. és 2., ELTE, Budapest, 1993.