Top Banner
Универзитет „Св. Кирил и Методиј“ Факултет за електротехника и информациски технологии Примена на теорија на игри во П2П и мобилни ад хок мрежи Предметен наставник: Изработил:
33

Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Dec 02, 2014

Download

Documents

Angel Dzhekov
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Универзитет „Св. Кирил и Методиј“

Факултет за електротехника и информациски

технологии

Примена на теорија на игри во П2П и

мобилни ад хок мрежи

Предметен наставник:

Изработил:

Проф. Д-р Аксенти Грнаров Ангел Џеков

2008, Скопје

Page 2: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Содржина:

Теорија на игри како алатка за правење стратегија и за предвидување на однесувањето на јазлите во Peer-to-Peer мрежи

I. Вовед.............................................................................................3II. Игра на услуга................................................................................5III. Неш еквилибриум на играта на услуга..............................................7

А. Еквилибриум на чиста стратегија......................................................7Б. Еквилибриум на мешана стратегија...................................................8

IV. Својства на еквилибриумот на НешА. Едноставност на пресметување на стратегијата на еквилибриум................10Б. Решавање на проблемот на ’шлепање’..............................................11В. Правило на 50 проценти..............................................................12Г. Правичност - Подеднакво споделување на штетата од

неефикасноста на системот...........................................................13Д. Намалување на ’алфа’ за зголемување на придонесот............................14

Користење на теорија на некомплетно кооперативни игри во мобилни ад хок мрежи

I. Вовед............................................................................................15II. Воведни објаснувања

А. Опис на теорија на игри..............................................................16Б. Опис на DCF............................................................................17

III. Опис на теоријата на некомплетно кооперативни игриА. Карактеристики на теорија на некомплетно кооперативни игри.................18Б. Состојба на игра.......................................................................19В. Процена на состојба на игра.........................................................19Г. Стратегија на еквилибриум...........................................................20

IV. Резултати од симулацијата.............................................................22V. Заклучоци.....................................................................................28

2

Page 3: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Теорија на игри како алатка за правење стратегија и за предвидување на однесувањето

на јазлите во Peer-to-Peer мрежи

Теоријата на игри може да се употреби во изучување на однесувањето на

јазлите во peer-to-peer (п2п) мрежи, кога јазлите добиваат услуга врз база

на нивната репутација (углед). Угледот се користи како механизам за

стимулирање на јазлите да споделуваат ресурси и овозможуваат

услужување на другите. Веројатноста за јазол да биде услужен е директно

пропорционална со неговиот моментален углед, а угледот се зголемува

единствено со услужување на другите. На овој начин се мимимизира

можноста за ’шлепање’. Теоријата на игри може да биде употребена од

страна на индивидуални јазли за определување на нивната оптимална

стратегија за нивото на учество во тој п2п систем. Освен тоа, теоријата на

игри дава интересен увид во севкупната природа на интеракцијата на

јазлите, ефикасноста на системот и изнаоѓање начини за подобрување на

истата.

I. Вовед

Peer-to-peer (П2П) мрежите се флексибилни дистрибуирани системи што им

овозможуваат на јазли (наречени peers, а ние овде ќе ги викаме ’врсници’)

да се однесуваат и како клиенти и како сервери, и меѓусебно да си

овозможуваат услуги. П2П е моќна вмрежувачка парадигма во подем, која

овозможува споделување на практично неограничени податочни и

процесирачки ресурси на целосно дистрибуиран, толерантен на грешки,

скалабилен и флексибилен начин.

Општо прифатено е дека шлепањето го гуши моментниот растеж и

распространета употреба на П2П системите. Постојат неколку предложени

механизми за решавање на проблемот со шлепање: (1) монетарна наплата

(снабдувачот на услугата добива соодветна компензација од корисниците

на истата), (2) репутациски шеми (јазли со повисок углед добиваат подобра

услуга од другите). Монетарната наплата вклучува фиктивна валута и бара

сметководствена инфраструктура за следење на различни трансакции на

ресурси. Таа го наплаќа тоа со помош на микронаплати. Иако монетарната

шема нуди чист економски модел, нејзината имплементација реално е

комплицирана. Повеќе ветува моделот на стимулација врз база на углед.

3

Page 4: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Подолу се проучува однесувањето на јазли во П2П мрежи кога

угледот се користи како механизам за стимулирање на јазлите да

споделуваат ресурси и да овозможуваат услуги. Веројатноста на јазол да

добие услуга е директно пропорционална со неговиот моментен углед, а

единствен начин јазолот да си го зголеми угледот е преку услужување на

други јазли. Ова го минимизира проблемот со ’неуслужливи шлепачи’, без

употреба на било каков централизиран ентитет и/или координација помеѓу

врсниците. Координација помеѓу врсниците не е потребна, затоа што тие

независно одлучуваат околу своите оптимални стратегии. Употребуваните

стратегии се симетрични, т.е. истата стратегија ја користат сите јазли.

Наспроти ова се протоколите, кои бараат различни јазли да се однесуваат

различно. Во П2П систем, сите јазли имаат иста улога, па доделувањето на

различни стратегии на јазли би претставувало непотребна компликација.

Моментно, П2П системите се користат главно за споделување на

документи како аудио, видео, итн. Сепак, општо познато е дека со

користење на П2П парадигмата можат да бидат споделени и други ресурси

како пресметковна моќ, фреквентен опсег, складирање на податоци, итн.

Постојат дури и предвидувања дека во иднина, големи ад-хок мрежи ќе се

организираат во П2П конфигурација, за да извршуваат комплексни

апликации од големи размери. Во таквите системи, влогот на

индивидуалните врсници би бил повисок, затоа што цената на

овозможување (и примање) услуги би била многу поголема (наспроти

сегашната цена на споделување филмови и музика, која е практично нула).

Затоа е и разумно да се претпостави дека сите врсници би се однесувале

себично како би ја максимизирле услугата што ја добиваат од системот.

Теоријата на игри е идеална алатка за моделирање на систем од

себични јазли. Ја моделираме интеракцијата на врсници во П2П систем како

бесконечно повторувана игра и пресметуваме Неш еквилибриум стратегии

(т.е. ниво на учество) на јазлите во таква игра. Врсниците ги користат

принципите на теорија на игри за да определат кога треба или не треба да

ги услужат другите. Секој врсник го третираме како рационален стратег, кој

сака да ја максимизира својата услуженост преку учество во П2П системот.

Врсниците добиваат вредност преку доаѓање до услуги (ресурси), а губат

вредност (интернет сообраќај) додека ги услужуваат другите. Со оглед дека

веројатноста да се биде услужен зависи од сопствениот углед (кој се

стекнува единствено преку услужување на другите), стратешките потези на

врсниците се во насока на максимизирање на вкупната добиена вредност,

т.е., се обидуваат со минимално ниво на услужување, да си ги

максимизираат шансите да бидат услужени. Концепцијата на Еквилибриум

на Неш од теоријата на игри може да се употреби за анализа на

4

Page 5: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

стратешките избори направени од страна на различни врсници. Може да се

проучи ефикасноста на системот и да се бараат начини за нејзино

подобрување.

Во реалноста, јазли извлекуваат вредност и од алтруизам (кој често е

резултат на небрежност, како што е оставање на запалени светла во празни

соби). Затоа, веројатноста да се биде услужен, реално е поголема одошто

тоа го тврдат пресметките од моделот презентиран во овој текст. Оттука, на

некој начин, овде презентираниот модел дава долна граница на ниво на

учество, под кое даден јазол не треба да оди.

За да се проучи однесувањето на јазлите, развиен е модел на игра на

интеракција помеѓу себични врсници, наречен игра на услуга. Потоа е

изведен еквилибриум на Неш за чиста и мешана стратегија на играта на

услуга. Испитани се неколку интересни и практични својства на овој Неш

еквилибриум. Потоа се дискутирани и некои други пристапи од теорија на

игри кон проблемот на шлепање во П2П мрежи.

II. Игра на услуга

Претпоставуваме дека животниот век на мрежата е бесконечен и го

делиме вкупното време во посебни временски периоди, претставени со за

. Во секој временски период, секој јазол добива барање за

услуга. Исто така во секој временски период, другата активност на секој

јазол е обезбедување на услуга за себе. Секое барање за услуга паралелно

или во низа се внесува во еден или повеќе провајдери на услуги. Барањето

се смета за исполнето кога провајдер од кого е побарана услуга ќе се

согласи да услужи. За поедноставување на работите, претпоставуваме дека

јазол секогаш бара точно една услуга и добива точно едно барање за услуга

во секој временски период. Претпоставуваме дека услужноста на јазол е

нула, доколку биде услужен повеќе од еднаш во еден временски период.

Понатаму, во фактичка имплементација, јазол може да прими повеќекратни

барања, но некои од тие барања може да доаѓаат од клиенти со низок углед

и затоа може да бидат игнорирани. Затоа, акцијата {Служи} (како што е

опишано подолу) кореспондира со ситуација каде што му се излегува во

пресрет на било кое од добиените барања во еден временски период.

Ја моделираме интеракцијата помеѓу врсници како бесконечно

повторувана игра. Една партија се игра во еден временски период. Во

играта, обележана со , јазли бараат услуга за себа и одлучуваат дали да

служат други. Попрецизно, играта е дефинирана вака:

5

Page 6: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Играчи: Сите врсници.

Потези: Множеството на потези за секој играч е {Служи, Не служи}.

Приоритети: Приоритетите на секој играч се претставени од

очекуваната вредност на функцијата на исплата, која доделува вредност

кога ќе се прими услуга, а трошок кога ќе се овозможи услуга.

Играта на услуга, која е бесконечно повторување на играта , ја

бележиме со .

Како што веќе споменавме, веројатноста со која играч бива услужен

зависи од неговиот моментален углед. Угледот на играч во даден

временски период се обележува со . Угледот на јазол зависи од неговите

перформанси во тековниот временски период, но и во претходните

временски периоди. Формално, дефиниција за ќе биде:

,

Во горнава равенка, изнесува 1 кога е овозможен сервис од играчот во

периодот , а во спротивно има вредност 0. Затоа имаме , т.е.

угледот на играч во секој временски период секогаш е вредност помеѓу (и

вклучително со) 0 и 1. Понатаму, во , угледот на сите играчи е 0, а во

, угледот едноставно изнесува . Параметарот е константа која при

процена на моментниот углед, ја доловува доделената важност на

моментните перформанси на играчот, наспроти неговите минати

перформанси. Ако е големо, тоа значи дека поголема важност се дава на

моментната услужливост на играчот, и обратно. Затоа, за големо , дури и

јазол со низок рејтинг може значајно да си го подобри угледот со

овозможување на услуга во тековниот временски период.

Претпоставуваме дека услужната информација без проблем се шири

низ мрежата и им е достапна а сите играчи, т.е. секој играч кога услужува

друг играч, ја дава таа информација на колку што е можно други играчи.

Примената информација потоа рекурзивно се дава на други играчи. Затоа,

може да се претпостави дека услужната информација се шири според

механизам на преплавување и е достапна за сите играчи.

III. Неш Еквилибриум на Играта на услуга

6

Page 7: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Според Фолк Теоремата на Неш, ако е акционен профил во Неш

еквилибриум за некоја игра , тогаш е исто така и за игра во која се

повторува бесконечен број пати.

Затоа, наоѓањето на Неш еквилибриум од се сведува на наоѓање

на Неш еквилибриум од играта . Ги вреднуваме еквилибриумите на Неш

од , и за чиста и за мешана стратегија. Со оглед дека предложениот

механизам на стимулација ја поврзува добивката со придонесот – добивката

е монотоно растечка функција од придонесот на играчот. Оттаму, ова е

некооперативна игра, каде што секој играч сака да ја максимизира својата

извлечена вредност. Класичниот концепт на еквилибриум на Неш укажува

на излез од бесконечниот циклус на шпекулации и контра-шпекулации

околу тоа кои стратегии играчите треба да ги користат.

Еквилибриум на Неш е акционен профил , таков што ниту еден

играч не може да мине подобро со одбирање на потег надвор од ,

доколку секој друг играч се придржува кон .

Точка на еквилибриум е локално оптимално множество на стратегии

(веројатности на услуга, т.е., колку да се услужуваат другите), каде што

ниту еден играч не може да ја подобри својата услуженост со отстапување

од стратегијата.

А. Еквилибриум на чиста стратегија

Акциониот профил каде што сите играчи се одлучуваат за потегот

{Не служи} е еквилибриум на Неш. Ова е така затоа што ако некој играч се

одлучи да служи, тогаш неговата исплата е , што е помалку од

исплатата 0, која ќе ја добие ако се одлучи да не служи. Исплатата на

играчот е кога ќе се одлучи да служи, затоа што сите други играчи се

одлучуваат за потегот {Не служи}, па играчот нема можност да го

материјализира својот зголемен углед, да добие услуга од другите (и да

оствари исплата ).

Се разбира, акциониот профил според кој сите играчи се одлучуваат

за потегот {Не служи} е несакан еквилибриум на Неш, затоа што

подразбира дека мрежата воопшто не обезбедува услуги. Како резултат на

тоа, целиот П2П систем се распаѓа, па затоа може да се каже дека овој

акционен профил е нестабилен еквилибриум и малку е веројатно да биде

постигнат (особено затоа што до некаде постои и алтруизам помеѓу јазлите

во мрежата).

Акциониот профил во кој сите играчи одбираат {Служи}, не е Неш

еквилибриум. Тоа е лесно воочливо, затоа што ако сите други служат, тогаш

7

Page 8: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

најдобра стратегија е да се отстапи, одбирајќи {Не служи}. На тој начин

играчот добива исплата наместо .

Затоа, заклучуваме дека единствениот Неш еквилибриум на чиста

стратегија за играта е кога играчите ќе се одлучат за потегот {Не

служи}, така што потегот {Не служи} се одбира во секој временски период

во . Ова, се разбира, не делува како можна конвергентна состојба за било

кој употреблив П2П систем.

Б. Еквилибриум на Мешана стратегија

Ја разгледуваме и можноста за Неш еквилибриум на мешана

стратегија за , каде што наместо детерминистички да ги одбираат своите

потези, играчите ќе бираат по случаен избор од множеството потези што ги

имаат на располагање. Поинаку кажано, играчите се одлучуваат за потегот

{Служи} во некои временски периоди и за потегот {Не служи} во

останатите временски периоди во .

Бараме симетричен Неш еквилибриум, затоа што сите играчи

припаѓаат на истата популација (т.е. ја имаат истата улога) и затоа е

полесно (односно не е потребна координација помеѓу играчите) да се дојде

до таков еквилибриум. (Симетричен еквилибриум на Неш е акционен

профил , кој е Неш еквилибриум и за било кои двајца играчи и .

Едноставно кажано, во симетричен Неш еквилибриум, сите играчи прават

исти потези (детерминистички или пробабилистички).) Ако играчите во

играта не се разликуваат значително или не се свесни за било какви

меѓусебни разлики, т.е. ако припаѓаат на единечна хомогена популација,

тогаш за нив е тешко да се координираат, па симетричниот еквилибриум во

кој сите користат иста стратегија е практично неизбежен. Инаку, единечна

хомогена популација подразбира дека сите врсници во П2П системот имаат

еквивалентни одговорности и способности.

Нека има Неш еквилибриум на мешана стратегија за , таков што

играчот го избира потегот {Служи} со веројатност и потегот {Не служи}

со веројатност . Овде има ненулта вредност, т.е. од страна на играчот

и на двата потези им е доделена позитивна веројатност. Со оглед на

претходно споменатата симетричност, за сите играчи важи истото и нема

потреба од користење на горниот индекс .

Очекуваната исплата на играч во временски период , кога ќе го

одбере потегот {Служи} е . Вредноста на оваа исплата ја

бележиме со . Слично, очекуваната исплата на играч во

временски период , кога ќе одбере потег {Не служи} е .

8

Page 9: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Вредноста на оваа исплата ја бележиме со . Исплатата на играч

кога овозможува услуга во определен временски период е ,

што претставува вредност на добиена услуга минус цена на овозможување

услуга. Изразот ја доловува идејата дека веројатноста да се биде

услужен е директно пропорционална со сопствениот углед. Затоа,

очекуваната исплата во мешана стратегија за играч што со веројатност ќе

одигра {Служи}, изнесува . На сличен начин се доаѓа и до

очекуваната исплата во мешана стратегија за играч што со веројатност

ќе одигра {Не служи}. Овде правиме претпоставка дека играчите прво

имаат можност да ги служат другите (и зголемат својот углед) пред да

побараат услуга за себе.

е угледот на играч кога служи во временски период , а е

угледот на играч што не служи во временски период . Од најпрвата

равенка во текстов, следува:

и

За Неш еквилибриум на мешана стратегија во конечни игри, важи

следново:

За секој играч, очекуваната исплата во еквилибриум е очекуваната

исплата за секој од неговите потези што ги користи со позитивна

веројатност.

Од оваа корисна карактеризација на Неш еквилибриум на мешани

стратегии, произлегува:

Со решавање по , се добива:

Мора да се спомене дека вредноста на не е константа, туку варира

во секој временски интервал во зависност угледот на јазолот на крајот на

претходниот временски интервал. Мешаната стратегија за

потезите {Служи, Не служи}, респективно, е Неш еквилибриум на мешана

стратегија. Под претпоставка дека не постои заговор помеѓу јазли, ако сите

други јазли ја следат горната стратегија, тогаш најдобра стратегија за секој

јазол е исто така да ја следи горната стратегија (од дефиницијата на

еквилибриум на Неш). Тоа е симетричен Неш еквилибриум на мешана

стратегија, како за , така и за . Тврдиме дека ова е постабилен

9

Page 10: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

еквилибриум од оној каде што ниту еден јазол не услужува, поради

следниве две причини: Прво, кога не се овозможува услуга, мрежата не е

корисна за никого. Второ, ако во пракса некои корисници успеваат да

извлечат конечна добивка од алтруизам на други корисници, тоа е во

директна спротивност со сценариото во кое ниту еден врсник не услужува.

IV. Својства на Еквилибриумот на Неш

А. Едноставност на пресметување на стратегијата на еквилибриум

Во претходниот дел ја пресметувавме веројатноста врз база на која

јазлите одлучуваат дали за нив е оптимално да служат или да не служат. Во

секоја партија од играта (или временски период), врз база на својот углед

од крајот на претходниот временски период, играчите одлучуваат дали

треба да овозможат услуга во тековниот временски период. Како што може

да се забележи, оваа веројатност не останува константна низ периодите и

зависи од угледот на играчот од крајот на последниот изминат временски

период. Играчите можат да го пресметуваат својот углед користејќи ја

најпрвата равенка од текстов, затоа што имаат прецизен увид за своите

потези во секоја од изминатите партии (периоди).

Слика 1. Промена на вредноста на угледот на играчите со текот на време,

започнувајќи во моментот t. На тројцата играчи на почетокот им се доделени

произволни вредности на углед. =0.5 и U/C=100.

Затоа, определувањето на Неш еквилибриум стратегија е прилично

едноставно за играчот. Мора да се напомене дека неизбежно се потпираме

на претпоставката дека врсниците добиваат услуга врз база на нивниот

10

Page 11: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

моментален углед. Како точно тоа се постигнува (или спроведува) е надвор

од доменот на оваа студија.

На Слика 1 е прикажан пример како угледот на врсник може да се

менува со текот на времето при следење на предложената стратегија на

еквилибриум. Зголемувањето на угледната вредност кореспондира со

временските интервали во кои се овозможува услуга, и обратно. Како што

може да се забележи, стратегијата на еквилибриум им гарантира на

играчите дека со текот на времето приближно ќе се изедначат во поглед на

овозможување услуга на другите, без оглед на стартната угледна вредност.

Б. Решавање на проблемот на ’шлепање’

Со оглед на тоа што Неш еквилибриумот на мешана стратегија му

доделува позитивна веројатност на потегот {Служи} (т.е. во секој

временски период, за секој играч постои позитивна веројатност дека ќе ги

служи другите), минимизиран е проблемот со шлепање во мрежата.

Едноставниот модел што е претставен овде, во кој угледот се користи како

основа за добивање услуга, предвидува дека во најдобар интерес на секој

врсник (вклучувајќи ги и шлепачите) е да ги служи другите. Како што е

прикажано на Слика 2, симулациите го поддржуваат ова однесување, т.е.

вкупната услуга што ќе ја добие јазол е во рамнотежа со вкупната услуга

што може да им ја понуди на другите.

Слика 2. Вкупно случаи на овозможување и добивање услуга на јазол во период

од 20 временски интервали (првиот и вториот број во секој квадрат означуваат

овозможени и добиени услуги, респективно). Без оглед на почетниот углед на јазолот

и на вредноста на алфа, услугите што јазол ги добива се скоро целосно во рамнотежа

со услугите што им ги овозможува на друтите. И овде, U/C=100.

В. Правило на 50 проценти

11

Page 12: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Од последната равенка произлегува значајно својство на еквилибриумот,

кое ја предвидува веројатноста со која врсник треба да ги служи другите

врсници. Ако земеме дека (т.е., го апроксимираме со нула во

последната равенка), тогаш добиваме дека . Со други зборови, ако

цената на овозможување услуга е занемарлива, Неш еквилибриумот на

играта на услуга предвидува дека играчите треба да се услужуваат во

помалку од 50% од случаите кога им е побарана услуга. Ова, иако делува

многу рестриктивно, е последица на тоа што сите врсници се себични и

повеќе би се шлепале, одошто би ги услужувале другите. Интуитивно,

доколку врсник знае дека сите други се однесуваат себично, т.е.,

овозможуваат што е можно помалку услуги, тогаш најдобра стратегија за

него не може да биде служење во поголем дел од времето (т.е. со

веројатност поголема од 0.5).

Од аспект на еквилибриум на Неш, горниот резултат може лесно да

се сфати преку следниов едноставен контра-пример. Ако за сите играчи е

познато дека ги услужуваат добиените барањата во поголем дел од

времето, тогаш било кој од играчите може лесно да си ја зголеми исплатата

со менување на стратегијата кон услужување на помалку од 50% од

барањата. Оттука, акционен профил во кој врсниците широкоградо се

услужуваат меѓусебно, не може да формира еквилибриум на Неш.

Резултатите од Слика 2 се значаен исход на направениот модел на

интеракција на јазли во П2П систем според теоријата на игри, каде што сите

учесници се однесуваат себично. Иако резултатот е интуитивно привлечен,

самиот модел обезбедува доказ базиран на теоријата на игри, кој го

објаснува таквото однесување на врсниците.

Г. Правичност – Подеднакво споделување на штетата од

неефикасноста на системот

Од заклучокот дека служење со веројатност помала од 0.5 е

оптимална стратегија (кога ), може да се претпостави дека

целокупната ефикасност на системот е сериозно намалена. Ова доаѓа од

тоа што барем половина од барањата за услуги не се исполнуваат.

Но, позитивно е тоа што стратегијата на еквилибриум носи

правичност затоа што цената на неефикасноста на системот не ја плаќа

еден врсник, туку истата е споделена (обратно пропорционално од угледот)

помеѓу сите врсници. Ова е од таму што барањето за услуга на секој врсник

веројатно ќе биде одбиено од врсникот што може да го услужи.

Претпоставуваме дека ако барањето на еден врсник е одбиено, тогаш

истиот ќе се обиде кај друг врсник што е во можност да го исполни истото

12

Page 13: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

барање. Во просек, веројатноста дека барањето на еден врсник е успешно

услужено во еден временски период е пропорционална со неговиот

моментален углед.

Слика 3. Намалувањето на ’алфа’ ги тера играчите да се услужуваат меѓусебно

со поголема веројатност. Во сите три случаи се користи почетна вредност на угледот

од 0.5. И овде, U/C=100.

Д. Намалување на за зголемување на придонесот

Како што може да се види од Слика 3, при пониска вредност на се

зголемува веројатноста од услужување. Поинаку кажано, за мало ,

врсниците се услужуваат меѓусебно со поголема веројатност. Ова е

разбирливо, затоа што определува колкава важност им се придава на

моментните перформанси на врсникот во однос на перформансите од

претходните периоди. Ниска вредност на (т.е. зголемување на значењето

на минатите активности на јазлите во однос на тековната активност) значи

дека врсниците мораат континуирано да овозможуваат услуга за да можат

да си го одржат угледот на висина и да пристапат до услуги од системот.

Од друга страна, ако е големо, врсниците ќе можат лесно да си го

зголемат угледот секогаш кога ќе услужат барање, без оглед на нивната

услужливост во претходните периоди.

Оттаму, ефикасноста на системот може на едноставен начин да се

подобри со поставување на што е можно пониско. Како што е прикажано

на Слика 3, со намалување на , вредноста на тежнее кон 0.5 (што е

највисока можна веројатност на услуга во систем со себични врсници и за

13

Page 14: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

). До истиот резултат може да се дојде и директно, доколку во

последната равенка се замени за и за .

14

Page 15: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Користење на теорија на некомплетно

кооперативни игри во мобилни ад хок мрежи

Во последно време, теоријата на игри станува корисна и моќна

алатка за истражување на мобилни ад хок мрежи (MANETs). Бежични ЛАН-и

(WLANs) можат да работат и во инфраструктурен и во ад хок мод, и се

најшироко употребуваните МАНЕТ-и. Во овој текст е предложен иновативен

концепт на теорија на некомплетно кооперативни игри, употребена за

подобрување на перформансите на WLAN. Во оваа игра, прво секој јазол ја

проценува моменталната состојба на играта (т.е. бројот на компетитивни

јазли) преку детекција на каналот. Потоа секој јазол ја менува својата

стратегија на еквилибриум преку нагодување на своите локални

натпреварувачки параметри врз база на проценетата состојба на играта. На

крај, играта се повторува конечен број пати, за да се добијат оптималните

перформанси. Резултатите од симулацијата подолу, покажуваат дека

некомплетно кооперативна игра може да го зголеми протокот во системот,

а да ги намали доцнењето, џитерот (jitter - несакана варијација на една или повеќе

карактеристики на периодичен сигнал во електроника и телекомуникации) и стапката на

изгубени пакети.

I. Вовед

Мобилните ад хок мрежи (MANET) играат се’ позначајна улога во

многу околини, како кај колаборативни и дистрибуирани пресметувања,

опоравување од катастрофи, контрола на движење, итн. Бежичните LAN-и

(WLAN-и) имаат распространета примена и под инфраструктурен и под ад

хок мод, како една од суштествените технологии за овозможување на

широкопојасен бежичен пристап. Оттука, анализата на перформансите и

подобрувањето на WLAN-и привлекуваат голем истражувачки интерес. IEEE

802.11 е еден од највлијателните WLAN стандарди, а неговиот основен

протокол за контрола на медиумски пристап (MAC) се нарекува

дистрибуирана координативна функција (DCF). Моментно, DCF де факто е

MAC стандард на MANET-и, широко користена во скоро сите тестирања и

симулации за истражување на MANET-и, иако постојат многу MAC протоколи,

некои дури и понови од DCF.

Во DCF нема централни јазли (т.е. базни станици или пристапни

точки) на каналскиот пристап на контролните јазли, и сите јазли

15

Page 16: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

компетитивно ги пренесуваат своите податочни рамки. Каналскиот пристап

на секој јазол има директно влијание на соседните јазли. Оваа интеракција

интуитивно посочува дека теоријата на игри би била многу добра алатка за

анализа и подобрување на перформансите на MANET-и, особено MAC

протоколите, како Aloha и DCF. При користење на теорија на игри кај MANET-

и, во предвид мора да се земат карактеристиките на DCF. Што се однесува

до теоријата на игри, предложена е употреба на нов концепт на нецелосно

кооперативна игра (т.е. конечно повторувана динамичка игра на

некомплетна информација). Во оваа игра, секој јазол ја прилагодува својата

еквилибриум стратегија според претпоставената состојба на играта,

односно според бројот на натпреварувачки јазли.

II. Воведни објаснувања

А. Опис на Теорија на Игри

Теоријата на игри е моќна алатка за проучување на ситуации на

конфликт и соработка, која се занимава со наоѓање на најдобрите потези за

индивидуалните донесувачи на одлуки (т.е. играчи) во овие ситуации, како

и со препознавање на стабилни исходи. Генерално, игрите можат да се

категоризираат на некооперативни и кооперативни игри. Теоријата на

некооперативни игри се занимава со анализа на стратешки избори и

експлицитно моделирање на процесот во кој играчот донесува одлуки во

сопствен интерес. Кај кооперативните игри пак, играчите можат да градат

врски. Теоријата на игри особено влегува во фокусот на вниманието во 1994

година, кога им беше доделена Нобелова награда за економија на Џон Неш,

Џон Харсанји и Реинард Селтен за нивниот голем придонес, главно кон

некооперативните игри. Во зависност од тоа дали потезите на играчите се

случуваат симултано или не, некооперативните игри можат да се поделат

во две категории: статични и динамични. Кај статична игра, играчите

истовремено се одлучуваат за стратегија и влечат потег, без да го знаат

изборот на другите играчи. Кај динамична игра, има точно определен

редослед на играње. Играчите влечат потег кога ќе дојдат на ред, знаејќи

што дотогаш одиграле другите. Во зависност дали играчите имаат целосна

информација за сите карактеристики на противниците во врска со

исплатата, некооперативните игри може да се поделат во две групи: игри

со комплетна и игри со некомплетна информација. Кај првите, сите играчи

ги имаат на располагање сите информации за карактеристиките на

противниците, нивните стратегиски можности, функции на исплата, итн. Кај

16

Page 17: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

вторите тоа не е случај. Во Табела 1 се прикажани четири типа на

некооперативни игри и нивните соодветни концепти на еквилибриум.

Статична игра Динамична игра

Игра со

комплетна

информација

Неш еквилибриум

Џон Неш (1950, 1951)

Совршен Неш еквилибриум на суб-игра

Реинхард Селтен (1965)

Игра со

некомплетна

информација

Бајесов еквилибриум на Неш

Џон Харсанји (1967-1968)

Совршен Бајесов еквилибриум на Неш

Реинхард Селтен (1975)

Крепс и Вилсон (1982)

Фуденберг и Тирол (1991)

Табела 1. Категории на некооперативни игри и соодеветни еквилибриуми

Б. Опис на DCF

DCF е шема со случаен пристап, базирана на мрежен, ресурсно

компетитивен протокол, кој ја слуша мрежата за да избегне судири

((CSMA/CA) – carrier sense multiple access with collision avoidance). Јазол со нов

пакет за пренесување, ја надгледува активноста на каналот. Ако каналот е

без работа за временски период, наречен дистрибуиран меѓу-рамковен

простор (DIFS), тогаш јазолот пренесува. Во спротивно, јазолот продолжува

да го надгледува каналот додека не измери неактивност со DIFS должина.

Кога тоа ќе се случи, јазолот генерира случајно уфрлен интервал на

повлекување, пред да почне да пренесува. Големината на интервалот се

нарекува aSlotTime. DCF усвојува експоненцијална шема на повлекување

(backoff). При пренос на секој пакет, времето на повлекување се одбира

униформно во интервал од [0, CW-1]. При првиот обид за пренос,

конфликтниот рок (contention window – CW) е поставен на вредност ,

која се нарекува минимален рок на конфликт. По секој неуспешен пренос,

CW се множи со се’ до максималната вредност .

Параметарот се нарекува постојан фактор и е поставен на 2, а се

нарекува максимален степен на повлекување и е максимален рок на

конфликт. Кога еднаш ќе стигне до , ќе остане на таа вредост

додека пакетот се пренесе успешно или додека времето за повторен пренос

го достигне лимитот . Додека се достигне лимитот, повторувањето на

обидите за пренос треба да престане, а пакетот да се отфрли.

III. Опис на теоријата на некомплетно кооперативни

игри

17

Page 18: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Скорешни истражувања покажуваат дека механизмот за

повлекување кај DCF има еден голем недостаток: кај оптоварена мрежа,

зголемувањето на вредноста на се остварува на сметка на

континуирана колизија по успешен пренос, затоа што не постои

информација за состојба која би го индицирала фактичкото ниво на

конфликт. Теоријата на некомплетно кооперативни игри може да го реши

овој проблем преку проценка на моменталната состојба на играта (т.е.

фактичка состојба на системот) и преку доделување стратегија на

еквилибриум на секој јазол врз база на проценетата состојба на играта.

А. Карактеристики на теорија на некомплетно кооперативни игри

Некомплетно кооперативните игри имаат три карактеристики. Прво,

кај DCF, јазлите не можат директно и на време да си ја разменат состојбата

на играта. Сепак, секој јазол може да ја процени состојбата на играта преку

детектирање на каналот. По доволно долго детектирање на каналот,

проценетата состојба на играта е доволно прецизна. Се разбира, со оглед

дека состојбата на играта е секогаш варијабилна, невозможно е секогаш

јазлите на време да доаѓаат до точната состојба на играта. Второ, секој

јазол може да дојде до некомплетна информација за состојба на играта. И

трето, некомплетно кооперативните игри пред се се’ конечно, а не

бесконечно повторувани игри.

Некомплетно кооперативна игра е стохастичка игра; секој временски

слот кореспондира со една состојба на играта. Од една страна, во секој

слот, јазли ги пренесуваат своите пакети; од друга страна, ја проценуваат

моменталната состојба на играта врз база на изминатите состојби. По

проценувањето на фактичката состојба на играта, јазлите ги нагодуваат

своите еквилибриумски стратегии. Поради варирање на состојба на играта,

еквилибриумската стратегија на секој јазол секогаш е променлива. Кај

некомплетно кооперативни игри, играчите истовремено одбираат

стратегии. Иако не знаат што другите ќе одберат сега, тие можат да ги

предвидат потезите на противниците врз база на случувањата што

претходеле.

Б. Состојба на игра

Повеќе студии на вреднување на перформанси покажуваат дека

перформансите на DCF се многу чувствителни на бројот на јазли што се

натпреваруваат за каналот, т.е. бројот на јазли што истовремено се

18

Page 19: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

обидуваат да испратат пакет до заедничкиот медиум. До овој број не може

да се дојде со DCF операција . Поради поедноставување, во овој текст,

состојба на играта ќе биде бројот на натпреварувачки јазли.

В. Процена на состојба на игра

Резултати од анализи покажуваат дека бројот на конкурентски јазли,

е функција од веројатност за рамковна колизија на конкурентски јазол

.

Фундаменталната претпоставка е дека, без оглед на бројот на

повторени пренесувања, веројатноста е константна и независна при секој

обид за пренесување. Покажано е дека веројатноста дека јазол пренесува

во случајно одбран слот, може да се изрази како функција од , така што:

(1)

Покажано е и дека веројатноста може да биде изразена како функција од

и , така што:

(2)

Со замена за според (1) во (2), и со решавање по , се добива:

(3)

Горнава равенка дава експлицитен израз на наспроти веројатноста

и параметрите на конфликт, како и .

Со оглед дека веројатноста може да биде независно мерена од

секој јазол со едноставно надгледување на активноста на каналот, следува

дека секој јазол може да ја процени вредноста на .

Потребно е да се забележи дека равенката (1) се темели на

претпоставка дека ограничувањето на повторени обиди е занемарено и

пакетот ќе биде испраќан бесконечно пати додека не биде пренесен

успешно. Доколку се земе предвид лимитот на испраќања, равенката (1) би

ја добила следната форма:

19

Page 20: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

При што горниот израз важи за , а долниот за . (4)

Г. Стратегија на еквилибриум

Во некомплетно кооперативната игра, секој играч има два можни

потези: Пренесувај и Чекај. Стратегија на еквилибриум е бесконечен вектор

на веројатности за пренос, , такви што ја максимизира користа

на секој играч кога во моментот постојат натпреварувачки јазли. На Слика

1 е прикажана табела на стратегии, со двајца играчи, каде што е

исплатата кога играчот успешно ќе изврши пренос, е исплата кога е во

состојба на чекање, а е исплата кога преносот ќе пропадне и .

Играчите во оваа игра ги користат за да ги определат нивните

веројатности за пренос, за да дојдат до поголема исплата.

Според теоријата на игри, играчот е јазол што се бори за каналот.

Бидејќи секој јазол повторно и повторно се бори за каналот, а мрежата има

многу јазли, потребен е многу сложен метод за определување на

стратегијата. Затоа, во моделот во овој текст, играч не е секогаш јазол. На

пример, ако ја анализираме еквилибриум стратегијата на јазол , тогаш

Играч 1 е јазолот , а Играч 2 (т.е. противникот) се сите други јазли

(т.е. јазлите итн).

Слика 4. Модел на некомплетно кооперативна игра со n јазли

20

Page 21: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

При употреба на теоријата на игри во Aloha MAC протокол,

предложена е експлицитна формулација за стратегијата под претпоставка

дека промени во состојбата на играта не влијаат врз постоењето на

еквилибриум. Сепак, таа е несоодветна за MANET-и, а DCF е премногу

сложена за да предложи експлицитна формулација. Во DCF, вредноста на

веројатностите за пренос може да се промени преку нагодување на

параметри за конфликт како што се минималниот рок на конфликт ( ),

максималниот степен на повлекување , максималниот рок на конфликт (

), постојаниот фактор и лимитот на испраќања . Во овој текст,

поради едноставност се врши нагодување само на еден конфликтен

параметар, .

Ако играч има пакети за праќање, пред да влезе во борба за

наметнување на свој пакет на каналот, играчот ја предвидува состојбата на

играта, т.е. бројот на јазли во конкуренција, . Откако ќе ја предвиди, тој

го нагодува на следниот начин:

(5)

враќа случајна вредност помеѓу и , а е најголемиот цел

број што не е поголем од . Резултати од истражувањата покажуваат дека

оптималната вредност на е зависна од бројот . Односот помеѓу

оптималното и е некаде помеѓу 7 и 8. За поедноставување, можеме

да ја добиеме вредноста на од горната равенка. Резултатите од

симулацијата подолу, покажуваат дека горната равенка доволно точно го

дава . Играч со поинакво има различни веројатности за пренос

и за колизија. При оптимално , веројатноста за колизија е најмала.

Значаен факт зад оваа стратегија е тоа што различни јазли може да

имаат различни веројатности на пренос во даден слот, затоа што може да

добијат различна проценета вредност на . Целта на секој јазол не е да си ја

максимизира исплатата во единечен слот, туку да си ја максимизира

очекуваната исплата низ сите слотови од почеток па се’ додека самиот

успешно пренесува. Бидејќи Играч 1 започнува да се натпреварува за

каналот за пренесување на своите пакети, пред да успее да пренесе, тој ја

проценува состојбата на играта. Состојбата на играта е секогаш

варијабилна од три причини. Прво, некои други јазли може да ја напуштат

играта, на пример затоа што успешно вршат пренос. Второ, на играта може

да и’ се приклучуваат новопристигнати јазли. И трето, со влегувањето на

21

Page 22: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Играч 1, состојбата на играта се менува, па Играч 2 (т.е. останатите јазли)

ќе ја детектираат оваа промена и ќе ги адаптираат сопствените

еквилибриумски стратегии на моментната состојба. За време на преносот,

по добивање на состојбата на играта, Играч 1 ги нагодува своите локални

параметри на конфликт.

IV. Резултати од симулацијата

За евалуација на теоријата на некомплетно кооперативна игра,

направени се следниве симулации во идеален канал без скриени терминали

и записи. Брзината на каналот е поставена на 11 Mb/s, m=5 и r=7. Пакетите

ќе бидат отфрлени само ако времето за препраќање го достигне

временскиот лимит на препраќање, а лимит на доцнење нема.

Нека бројот на јазли порасне од 10 на 90 со чекор 20 и нека секој

јазол секогаш има пакети за праќање. Со откривање на каналот, секој јазол

ја проценува состојбата на играта, т.е. бројот на конкурентски јазли, а потоа

го нагодува својот конфликтен параметар . Заситениот капацитет,

доцнење, џитер и стапка на загубени пакети, се прикажани на Сликите 2-5.

Слика 2 покажува дека заситениот проток во некомплетно

кооперативна игра е повисок одошто кај DCF, особено кога бројот на јазли е

голем. Кога бројот на јазли се зголемува, протокот кај DCF се намалува

поради судири. Кај некомплетно кооперативна игра пак, протокот безмалку

останува константен затоа што секој јазол може да се адаптира на

варијабилните состојби на играта и да одбере соодветна стратегија на

еквилибриум.

Слика 3 покажува дека доцнењето во заситување кај некомплетно

кооперативна игра е помало одошто кај DCF. Кај DCF секој јазол доаѓа до

оптимално по неколку колизии. Кај некомплетно кооперативната игра,

секој јазол доаѓа до оптимално по проценување на состојбата на играта.

Слика 4 покажува дека џитер во заситување кај некомплетно

кооперативна игра има многу помалку одошто кај DCF, особено кога бројот

на јазли е голем.

Слика 5 покажува дека во заситување, стапката на губиток на пакети

кај некомплетно кооперативни игри е многу помала одошто кај DCF. Кај

некомплетно кооперативни игри, стапката на губење на пакети е нула, што

е многу привлечен факт.

22

Page 23: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Слика 5. Проток во услови на заситување

Слика 6. Доцнење во услови на заситување

23

Page 24: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Слика 7. Џитер во услови на заситување

Слика 8. Стапка на губење на пакети во услови на заситување

Нека има 50 јазли и нека секој јазол генерира нови пакети според

Поасонов процес во случаи на незаситеност. Иницијално, стапката на

пристигање на пакети е поставена да биде пониска одошто кај случаи на

24

Page 25: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

заситеност, за потоа да се зголемува така што на крајот на симулацијата

сите јазли се скоро во услови на заситување. Протокот, доцнењето, џитерот

и губитокот на пакети се прикажани на Сликите 9-12.

Сликите 9-12 покажуваат дека перформансите на некомплетно

кооперативна игра се подобри од оние на DCF кога мрежата ќе се оптовари.

Слика 9. Проток во незаситени услови

Слика 10. Доцнење во незаситени услови

25

Page 26: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

Слика 11. Џитер во незаситени услови

Слика 12. Стапка на губење на пакети во незаситени услови

26

Page 27: Primena Na Teorija Na Igri Vo p2p i Mobile Ad Hoc Nw

V. Заклучоци

Овој текст предлага подобрување на системските перформанси на

Мобилни и Ад Хок Мрежи со помош на некомплетно кооперативна игра. Во

оваа игра, секој играч (јазол) прво ја проценува состојбата на играта, т.е.

бројот на конкурентски јазли. Второ, врз база на проценетата состојба, секој

играч ја нагодува својата еквилибриумска стратегија со менување на своите

локални параметри на конфликт. И трето, играта се повторува конечен број

пати за да се дојде до оптимални перформанси. Резултатите покажуваат

дека некомплетно кооперативната игра е соодветна алатка за подобрување

на перформанси на MANET-и.

Теоријата на некомплетно кооперативни игри е нов концепт, па

потребно е детално да се развијат и математички да се докажат нејзиниот

еквилибриум и употребната функција. Второ – во оваа студија се

претпоставува дека секој јазол може брзо и прецизно да дојде до бројот на

конкурентски јазли. Ова во голема мера ги поедноставува работите, но

реално сеуште претставува нерешен проблем. Иако постојат механизми за

проценка, како ARMA и Kalman Filters, тие се базираат на повеќе строги

претпоставки и се премногу комплексни за да можат да се имплементираат.

Затоа се продолжува со истражувања за пронаоѓање на едноставен

алгоритам за проценка на состојба на игра.

27