ТЕХНИЧЕСКИ УНИВЕРСИТЕТ - СОФИЯ КАТЕДРА „КОМПЮТЪРНИ СИСТЕМИ” маг. инж. МИРОСЛАВ ДИМИТРОВ ПЕТРОВ МОДЕЛИ И АЛГОРИТМИ ЗА ИЗВЛИЧАНЕ НА ИНФОРМАЦИЯ В СИСТЕМИТЕ ЗА УЕЙВЛЕТ-БАЗИРАНО ТЪРСЕНЕ ПО СЪДЪРЖАНИЕ АВТОРЕФЕРАТ на дисертационен труд за присъждане на образователна и научна степен „ДОКТОР” докторска програма „Автоматизирани системи за обработка на информация и управление” научно направление: 5.3. “Комуникационна и компютърна техника” Научни ръководители: проф. д-р инж. Пламенка Боровска проф. д-р инж. Маргарита Тодорова Рецензенти: проф. д-р Огнян Наков проф. д-р Кънчо Иванов София , 2014
31
Embed
МОДЕЛИ И АЛГОРИТМИ ЗА ИЗВЛИЧАНЕ НА …konkursi-as.tu-sofia.bg/doks/SF_FKSU/ns/206/avtoreferat.pdf · За построяването на...
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
ТЕХНИЧЕСКИ УНИВЕРСИТЕТ - СОФИЯ
КАТЕДРА „КОМПЮТЪРНИ СИСТЕМИ”
маг. инж. МИРОСЛАВ ДИМИТРОВ ПЕТРОВ
МОДЕЛИ И АЛГОРИТМИ ЗА ИЗВЛИЧАНЕ НА
ИНФОРМАЦИЯ В СИСТЕМИТЕ ЗА УЕЙВЛЕТ-БАЗИРАНО
ТЪРСЕНЕ ПО СЪДЪРЖАНИЕ
А В Т О Р Е Ф Е Р А Т
на дисертационен труд за присъждане
на образователна и научна степен
„ДОКТОР”
докторска програма „Автоматизирани системи за обработка на
информация и управление”
научно направление: 5.3. “Комуникационна и компютърна техника”
Научни ръководители: проф. д-р инж. Пламенка Боровска
проф. д-р инж. Маргарита Тодорова
Рецензенти: проф. д-р Огнян Наков
проф. д-р Кънчо Иванов
София , 2014
2
Дисертационният труд е обсъден и насочен за защита от катедрен съвет на катедра
„Компютърни системи“ при ФКСУ, Технически университет – София.
Защитата на дисертационния труд ще се състои на 07.10.2014 г. от 17:00 ч. в зала 2140
Материалите по защитата са на разположение на интересуващите се в канцеларията на
ФКСУ, каб. 1443А на ТУ–София.
Автор: маг. инж. Мирослав Димитров Петров
Заглавие: М о д е л и и а л г о р и т м и з а и з в л и ч а н и е н а и н ф о р м а ц и я в
с и с т е м и т е з а уе й в л е т - б аз и р а н о т ъ р се н е п о с ъ д ъ р ж а н и е
Тираж: 30 бр.
Печатна база на ТУ-София
3
ОБЩА ХАРАКТЕРИСТИКА НА ДИСЕРТАЦИОННИЯ ТРУД
Актуалност на проблема
Все по-интензивното навлизане на съвременните информационни технологии в
системите за организация, съхранение, търсене и пренос на данни е предпоставка за
непрестанното увеличаване, както на количеството и обемите на колекции изображения, така
и на различните типове мултимедийни бази от данни. В тази връзка въпросите за
разработването на ефективни методи за индексиране и извличане на изображения по
съдържание, разпознаване и идентификация, притежаващи бързодействие, надежност и
сигурност продължават да бъдат открити, актуални и динамично развиващи се.
Дисертационният труд е посветен на системите за търсене по съдържание, спектрално
индексирано чрез различни уейвлетни преобразувания. Основното предимство на тези
многомащабни трансформации пред други спектрални методи е възможността за
анализиране на обектите при различни резолюции.
Точките, в които протичат преходни процеси в сигналите и изображенията, се явяват
носители на важна информация и те могат да бъдат идентифицирани по максимумите на
модула на уейвлет-преобразуванието. Следователно, изолираните особености на сигнали и
изображения могат да бъдат използвани за построяване на признаково пространство в
системите за разпознаване. Това прави актуална задачата за разработване на системи за
уейвлет-базирано търсене по съдържание.
Цел и задачи на дисертационния труд
Основната цел на дисертационният труд е да се разработят модели и алгоритми за
извличане на информация в системите за уейвлет-базирано търсене по съдържание на
сигнали и изображения, индексирани по локалните им особености.
В съответствие с поставената цел, на база извършения анализ на системите за търсене
по съдържание, в работата се решават следните задачи:
1. Построяване на модел на система за търсене на сигнали по тяхното съдържание,
индексирано чрез локалните им особености и реализацията му.
2. Построяване на модел на система за търсене на изображения по тяхното
съдържание, индексирано чрез локалните им особености и реализацията му.
3. Разработване на алгоритъм за извличане на компютърно-томографски изображения
от медицински бази данни:
- на база репагулярно уейвлет-преобразувание;
- по проекционни данни.
4
Научна новост
В съответствие с направените анализи и изводи са разработени модели на системи за
уейвлет-базирано търсене по съдържание на сигнали и изображения, индексирани чрез
локалните им особености, с отчитане на техните позиции. Проведен е съответния анализ на
уейвлетните преобразувания за определяне на базисния уейвлет чрез ненормираната
ентропия на Shannon. Предложена е методика за определяне на оптималните (по дадени
критерии) параметри на разработените системи, с цел намаляване на размерността на
дескрипторното пространство, времето за изпълнение и повишаване на точността на
извличане. Реализиран е нов алгоритъм за уейвлет-базирано търсене по съдържание в
пространството на Радон. Проведено е разпознаване на изображения по проекционни данни,
показващо по-висока точност (на база метрика) в сравнение с това по възстановените
срезове. Проведен е еднофакторен дисперсионен анализ за изследване на устойчивостта на
предложените алгоритми за извличане на изображения, относно влиянието на факторите
ротация, контраст, яркост и шум.
Приложимост и полезност
Част от получените в дисертационния труд резултати са използвани в:
проект № РНФ02-19 (RNF_09_0061) 2009 г. Фонд „Научни изследвания” конкурс
„Развитие на научната инфраструктура – 2009” на тема: Проектиране и изграждане
на устройство за безконтактно ултразвуково изследване на среди и материали с
възможност за вграждане в автоматизирани производствени системи;
учебен процес за обучение на студенти от бакалаварска степен, специалност
„Компютърни науки” по дисциплината „Компютърно зрение”.
Апробация
Резултатите от дисертационния труд са докладвани изцяло в катедра „Компютърни
системи“ на Технически Университет-София, а основните ѝ части са публикувани в списания
и сборници на научни конференции: Computer & Communications Engeneering, Serdica Journal
of Computing, International Conference AUTOMATICS AND INFORMATICS’09, International
Conference AUTOMATICS AND INFORMATICS’10, Sixth International Conference "Computer
Science" 2011, XV Майски четения “Дни на науката 2011” и XVIII Майски четения “Дни на
науката 2014”.
Обем и структура
Дисертационният труд съдържа увод и основен текст, структуриран в четири глави,
заключение, приложения и библиография. Обемът е 186 страници, списъкът на
литературните източници включва 130 заглавия, от които 88 на латиница и 8 интернет
източници.
Представен е списък на 7 публикации, свързани с дисертационния труд.
5
КРАТКО СЪДЪРЖАНИЕ НА ДИСЕРТАЦИЯТА
Увод
В увода е обоснована необходимостта от разработването на специализирани
алгоритми за извличане на данни от медицински бази. Тази необходимост се поражда, както
от специфичните особености на медицинските изображения в сравнение с тези от общ
характер, така и от потребностите на лечебно-диагностичната практика, научно-
изследователската и преподавателската дейности в медицинските заведения.
ГЛАВА ПЪРВА
СИСТЕМИ ЗА ТЪРСЕНЕ ПО СЪДЪРЖАНИЕ И МНОГОМАЩАБНИ МЕТОДИ
ЗА ОБРАБОТКА НА ДАННИ
Разработените към настоящия момент методи за извличане на графична информация
се разделят основно в две направления: методи за търсене по текстова анотация (Text-Based
Image Retrieval – TBIR) и методи за търсене по съдържание (Content-Based Image Retrieval –
CBIR). Описването на данните в системите от първия вид се извършва с помощта метаданни
(ключови думи, наименования на изображения и др.). Сред основните недостатъци на тези
системи могат да се посочат: възможността за различна интерпретация на метаданните,
описващи съответния обект и заявените данни от потребителя; необходимостта от
значителен времеви и човешки ресурс, както и възможността за получаване на неточни
резултати от търсенето.
За преодоляване на посочените проблеми се използва вторият подход – CBIR.
Заявеното за извличане изображение от базата данни може да бъде получено от скенер,
видеокамера, компютърен томограф или скица, направена от самия потребител. Този базов
подход за формиране на образеца се среща под различни наименования: търсене или
извличане по съдържание (образец, подобие, скица).
Текстурата се явява главен признак на изображенията от гледна точка на зрителното
им възприемане и разпознаване от човека, затова тя е предпочитана при построяването на
признаковото пространство в CBIR-системите.
Уейвлет-методите за описване и анализиране на текстурата се основават на базовото
свойство на уейвлет-анализа за представяне и анализиране на изображенията на различни
мащабни нива, т.е. при различни резолюции. Елементите на уейвлет-пространствата
отразяват промените, които протичат в спектъра на сигнала, при прехода от едно мащабно
ниво към съседното му. При фиксиран базис в тези пространства, носители на тази
информация се явяват съответните уейвлет-коефициенти. Затова уейвлет-преобразуванието
може да бъде използвано за спектрално индексиране на данните в системите за търсене по
съдържание.
6
Преобразуванието на Радон е в основата на компютърната томография, чиято цел e
анализиране на вътрешната структура на изследвания обект, посредством поредица от
успоредни напречни сечения. Два са основните етапа в работата на съвременния томограф –
регистрация на проекциите на анализирания обект, които като цяло задават неговия образ в
пространството на Радон и възстановяване на томографското изображение по получения
радоновски образ. Един от основните принципи в статистическата теория за вземане на
решения гласи, че всяка предварителна обработка на изходните данни може само да намали,
но не и да повиши съдържащата се в тях информация. Прилагането на този принцип в
системите за търсене води до използването на проекционните данни в задачата за
разпознаване, вместо възстановеното томографско изображение.
Изводи
1. Разширените матрици на съседство, използвани при организацията на система за
търсене на медицински изображения, отразяват добре основните им признаци (текстура,
цвят и форма), но пораждат висока размерност на дескрипторното пространство.
2. За построяването на характеристичните вектори в CBIR-системите, могат да бъдат
използвани уейвлет-коефициентите, тъй като те се явяват индикатори на промените,
протичащи в спектрите на сигнали и изображения.
3. Използването на подходящ базисен уейвлет при спектралното индексиране води до
значително намаляване на дескрипторното пространство.
4. Обратното преобразувание на Радон води до намаляване на информационното
съдържание на проекционните данни, което може да бъде отчетено в методите за
идентификация.
ГЛАВА ВТОРА
УЕЙВЛЕТ-ИНДЕКСИРАНЕ НА СИГНАЛИ НА БАЗА ЛОКАЛНИТЕ ИМ
ОСОБЕНОСТИ
2.1. Локална регулярност на сигнали и уейвлет-преобразуванието им
Описването на регулярността на сигналите в даден интервал (глобално) или в дадена
точка (локално) се осъществява посредством т. нар. показател на Hӧlder. Сигналът s t
удовлетворява условието на Hӧlder ( 0 1 ) в точката 0t , ако съществува константа
0 0H H t , такава че е изпълнено неравенството 0 0 0s t s t H t t
за всички стойности на
t , близки до 0t . За дефинирането на глобалната регулярност се използва понятието
равномерно условие на Hӧlder, ако горното неравенство е изпълнено за всяка точка от
даден интервал и константата 0H не зависи от избора на точката 0t . Най-малката от всички
7
стойности на , за които е изпълнено това неравенство се нарича показател или експонента
на Hӧlder [56].
Точката 0t се нарича особена за сигнала s t , ако показателят на Hӧlder в нея не е
равен на единица. Равномерната и точковата регулярност на сигналите е тясно свързана с
асимптотичното поведение на уейвлет-коефициентите им при малки мащаби и при
определени ограничения за базисния уейвлет – 0,5,, a bs A a , където A е константа и
0 1 .
2.2. Определяне на точките на рязко изменение на сигналите чрез максимумите
на модула уейвлет-преобразуванието им
Локалната регулярност на сигнала s t в дадена точка 0b се измерва с намаляването на
0,sW a b , при малки мащаби, в околност на тази точка.
Максимум на модула на уейвлет-преобразуванието се нарича всяка точка 0 0,a b , за
която функцията 0,sW a b има локален максимум при 0a a . За избягването на случаите, в
които тя е константа, се предполага наличието на строг локален екстремум поне в едната
полуоколност на точката 0a . Ако ,sW a b няма локални екстремуми при малки мащаби, то
сигналът е локално регулярен. Откъдето следва, че 0b е особена (сингулярна) точка на
сигнала s t , ако съществува редица от уейвлет-максимуми ,r r ra b
, която е сходяща за
мащаби, клонящи към нула, т.е. 0lim rr
b b
и lim 0rr
a
. Следователно, локализирането на
особеностите на сигнала се извършва посредством намирането на точките, към които клонят
максимумите на модула на уейвлет-преобразуванието му при малки мащаби.
За намирането на потенциалната изолирана особеност на сигнала в точка 0b се
проследява намаляването на уейвлет-максимумите на модула в нейния конус на влияние.
Същественото в тези разглеждания е факта, че ако базисния уейвлет е с компактен
носител и има n нулеви момента, то съществува функция t с компактен носител и
ненулева средна стойност – 0t dt
, такава че 1n n
t t . Тогава уейвлет-
преобразуванието на сигнала s t може да се представи във вида ,n
ns an
dW a b a s b
db ,
където 1
a
tt
aa
, т.е. уейвлет-преобразуванието на сигнала е пропорционално на n -
тата производна на конволюцията на сигнала с a t в области, пропорционални на мащаба.
2.3. Двоично уейвлет-преобразувание
Максимумите на модула на непрекъснатото уейвлет-преобразувание характеризират
8
локалните сингулярности на сигнала, описващи се посредством показателя на Hӧlder. На
практика анализираните сигнали се задават с отчетите си, получени от дискретизацията на
аналоговия сигнал. В тази връзка възниква въпросът – дали тази дискретизация не лишава от
смисъл понятията сингулярност и показател на Hӧlder? При определени условия, наложени
на базовия уейвлет се оказва, че съответните уейвлет-коефициенти, като функции на
мащабния параметър, се явяват измерител на регулярността на сигнала.
Уейвлет-преобразуванието 2 ,js
jW b
се получава по формулата за непрекъснатата
трансформация, като параметърът a се задава с двоичната скала 2 j
j
. Нека базисният
уейвлет удовлетворява неравенствата 2 j
j
A B
, където A и B са положителни
константи, а с е означено преобразуванието на Фурие на функцията . Полученото
преобразувание се нарича двоично уейвлет-преобразувание, а самият уейвлет – двоичен. Това
преобразувание притежава свойствата на непрекъснатото, в частност остават в сила
твърденията за глобална и локална регулярност. За запазването на инвариантността относно
преместването, задължителна в задачите за разпознаване, в дисертационния труд се използва
SDWT (Stationary Discrete Wavelet Transform).
2.4. Модел на система за търсене по съдържание на сигнали на база изолираните
им особености
За построяване на модела на системата се използва база данни от сигнали iS s n ,
където maxmax, 0,1,...,2 1,
ki I n k и е фиксиран двоичен уейвлет. SDWT поражда
еднозначно представяне на всеки сигнал от базата S във векторното пространство на
признаците 1 2 max, ,..., , 1i i k i
i I
D s D s D s k k
. При извършването на пълна декомпозиция на
сигналите, т.е. при maxk k , размерността на това пространство ще е равна на max2 1k
.
Първоначалното ѝ намаляване може да се осъществи посредством използването на
значимите уейвлет-коефициенти. Отделянето им се извършва с помощта на прагова
обработка по определен критерий, скоростта на изменение на ентропията на Shannon и др. За
всяко ниво на декомпозиция 1,2,...,r k се определят по rm съответно най-големи и най-малки
детайлизиращи коефициента, съответстващи на максимумите на модула на SDWT. По този
начин се конструира 2k блокова матрица на признаците (дескрипторите) ,D s s S . За
r тото ниво на разлагане всеки блок представлява 2 rm мерен масив: единият е rP s ,
съдържащ стойностите на тези локални екстремуми, а другият е rL s и съдържа техните
позиции, т.е. точките на екстремумите. Аналогична матрица на дескрипторите 0D s се
построява и за всеки тестови сигнал 0s .
9
Сходството на матриците на дескрипторите D s и 0D s се оценява посредством
разстоянията между съответните масиви: 0 01
,iL r i r
r kmin L s L s
и 01max ,i
P r i rr k
P s P s
,
където 0 е релацията равенство в множеството на реалните числа, а е фиксирана
метрична функция.
Резултатът от търсенето по съдържание в базата S е множеството от подобни
(релевантни) сигнали 0,iR s i I I , ако 1
2
kiL r
r
m
и iP , за всяко 0i I . Параметрите
0 ,I и се задават допълнително от потребителя. На фиг. 2.3 е представена блокова схема
на предложената система за търсене по съдържание.
изходен
сигнал
заявен
сигнал
индексни
матрици
характеристичен
вектор
определяне
на сходство
индексни
матрици
индексирана
базаданни
Базаданни
изходни
резултати
сортиране по
метрика
Електромиограф
потребителхарактеристичен
вектор
фиг. 2.3. Блокова схема на системата за търсене по съдържание
2.5. Методика за определяне на параметрите на системата за търсене в база
данни от медицински сигнали
За тестването и анализирането на алгоритъма за търсене е използвана специално
създадена база данни от медицински сигнали. Входните данни са от проведено
електромиографско изследване на биоелектричната активност на осем различни мускула
(бицепс и трицепс – за лява и дясна ръка, преден и заден бедрен мускул – за ляв и десен крак)
на четирима пациенти, при извършването на различни физически действия – бягане,
скачане, вървене и навеждане. За целта към всеки изследван мускул се прикрепя иглен или
контактен електрод, посредством който се осъществява отвеждането на биосигналите до
входа на електромиографа за регистрирането им. Данните за всяко измерване са съхранени в
отделни текстови файлове в ASCII формат. Всеки един от сигналите е представен с
приблизително 10000 отчета, които се редуцират до 9216 на брой – ограничение, налагащо се
от изискването на алгоритъма за реализиране на SDWT. Те се подреждат в многомерен масив
10
1 2 3 4, , ,s i i i i , чийто индекси съответстват на: 1i вид на физическото действие, което се
изменя в диапазона от 1 до 4, съответно за анализираните двигателни задачи: бягане,
скачане, вървене и навеждане; 2i номер на изследваното лице, който също се изменя в
диапазона от 1 до 4; 3i номер на измерителния канал, изменящ се в диапазона от 1 до 8 ; 4i
степен на зашумяване, изменяща се в диапазона от 1 до 8, като при 4 1i сигналът е в реалния
си вид, без добавянето на допълнителен шум. Останалите – 4 2 8i , съответстват на
стойностите на средноквадратичното отклонение 1,5,10,20,25,30,35 .
Определянето на параметрите на системата за търсене по съдържание в построената
база медицински сигнали, се основава на сравнителен уейвлет-анализ. За тази цел се налага
решаването на следните задачи:
определяне на най-информативното ниво на декомпозиция;
избор на анализиращия базисен уейвлет;
минимизиране на размерността на дескрипторното пространство.
В качеството на анализиращи базисни уейвлети са използвани представители на
следните три основни групи:
ортогонални уейвлети с компактен носител – Daubechies (db2; db3; db4);