ر ی ب ک ر می ی ا عت ن ص گاه ش ن دا ی ک ش ز پ ی س د ن ه م کده ش ن دا ش& ی( پ رل ی+ ب ک ز مدل- پ ی ت ت- ن م0 ن& ی- پ زد- پ ده و کار ع ش ی ور ت0 ا= ن در ش ن ا=را م ت س شی دی ن- ب ی مل دعا ن چ های اد: ن س ا واه خ د ن چ و ت ر کی ای د ا=ق- اب ن- چ ده: ن ه ه دQ ارائS مدی ح م ه ل عاد رماه ا= د1389
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
دانشگاه صنعتی امیرکبیردانشکده مهندسی پزشکی
بین مبتنی بر مدل کنترل پیشتوزیع شده و کاربرد آن
های بندی سیستم آرایشدراستاد:چندعاملی
جناب آقای دکتر توحیدخواهارائه دهنده:
عادله محمدی
1389آذرماه
فهرست مطالب
عاملAgent
ها درك كرده و سنسور را از طري!ق محي:ط ك!ه وجودي!ک كند. ميعمل بر روي آن خودمختاربه صورت
3
عامل در قالب يك سيستم فيدبكي
4
خودمختاريAutonomy
وجود عام!ل هر ي!ا انس!ان مس!تقيم دخال!ت بدون گيري و عم!ل خود داراي استقالل ديگ!ر، در تص!ميم
است.
5
عامل ها خودمختارند :احساس محیط خود و سایر عامل ها رد و بدل اطالعات با سایر عامل هامحاسبه و اجرای اعمال کنترلی الزم
برای رسیدن به سهم خود در تابع هدف
6
7
سیستم های چندعاملیMulti-agent Systems
مفهوم وقت!ي درک با عام:ل تعدادي در کنار ه!م قرار گرفت!ه تا در خودمختاري
فردي، اهداف جمعي كنار عمدتاً هدف كنند، دنبال را راس!!تا همان در واالتري پيدا تجلي چندعامل!ي هاي س!يستم عنوان
کند ميتحقق هدفی در سطح سیستم
7
88
مفاهيم مربوط به سيستم هاي چندعاملي
همکاریCooperation
توافق عامل ها برای داشتن هدفی مشترک با سایر عامل ها، 1(
که این هدف معموال به صورت آفالین مشخص می شود.
به اشتراک گذاشتن اطالعات به صورت 2(آنالین برای تحقق هدف مشترک
9
Distribution
ویژگی ذاتی سیستم های چندعاملی :توزیع شدگی
یعن!ی ه!ر عام!ل توس!ط انتقال اطالعات محلی با سایر عامل ها باید ”مختارانه“ عمل کند.
10
کنترل توزیع شده طبیعت ابعاد وسیع سیستم ها
کاربردهای ابعاد وسیع •سیستم های قدرت• سیستم های توزیع آب• سیستم ترافیک• سیستم های تولید• سیستم های اقتصادی•
11
DMPC vs. CMPC
ورودی کنترلی کل 12
دینامیک کل سیستم
حلیک
مسئلهبهینه سازی
ورودی های کنترلی محلی
دینامیک تک تک عامل ها
حلچند
مسئلهبهینه سازی
کنترل بهینه غیرمتمرکزOptimal Decentralized Control
• Optimal control problem subject to decentralized information structure constraints
که • محل!ی های حال!ت ب!ه فق!ط محل!ی فیدب!ک ه!ر اطالعات آنها کامل است دسترسی دارد
13
Optimal Decentralized Controllers
حالت های هر زیرسیستم و همسایه های آن •در اطالعات انتقال یا گیری اندازه ب!!ا
دیگری پارامترهای فضایی مختص!ات بر عالوه گيري دخیل هستند. نیز در تعیین تصميم
شبكه پدافند موشكي پارامترهاي!ي مث!ل فاص!له ام!ن از يكديگر، ميزان
مراكز هم از فاص!له و اختفاء ميزان پوشان!ي، حساس نيز مورد توجه است.
24
مثال
موانع هوشمند/ غيرهوشمند تأثي!ر محيط حرك!ت عامل تح!ت در محي!ط ه!ا
مي محدوديت محدود اي!ن از يك!ي ها شود. وجود موانع است.
موانع استاتيكدر پارامترهاي هدف تأثيرگذار نيستند.
آنها ب!ا تعام!ل و بوده هوشمن!د غي!ر موان!ع اي!ن آسان است.
25
در مقاب!ل ممك!ن اس!ت موانع!ي وجود داشتهباشن!د ك!ه ابعاد هدف را تغيير داده و بعضاً در
عامل بي!ن رقاب!ت بروز ممكن ص!ورت ه!ا، اس!ت كالً ص!ورت مس!ئله را تغيير دهند.)لزوم
تطبيق و يادگيري(
26
کاربردهاشبكه! سنسورهاي بي سيم در محيط هاي تداخلي•انجام عمليات جستجو )امداد و نجات، مين يابي(•كنترل حركت ماهواره در مدار زمين•روابط بين المللی•امنيت شبكه هاي اينترنتي•مديريت بحران و منابع•سپر دفاع موشكي•محيط نبرد•
27
ارز هاي معادل يا هم واژهكنند تر بررسي مي های خاصي را دقيق هر يك جنبه•
28
ائتالف Coalition
دنبال عامل• را يكساني اهداف الزاماً ه!!ا انجام نمي ادامه در اس!ت ممك!ن ول!ي كنن!د،
به زمان!ي خاص!ي در مقاط!ع وظاي!ف محول!ه يكديگر نياز داشته باشند.
كل!ي • ائتالف در حال!ت هدفدار و موقت ” شكل میان!ی هدف ي!ك اس!اس بر ك!ه بوده
رس!د كه هدف از گرفت!ه و زمان!ي ب!ه پايان ميبي!ن رفت!ه باش!د ي!ا ادام!ه آ!ن ب!ا اهداف اوليه در ائتالف در حضور ادامه اينك!ه ي!ا باش!د تضاد
سودي براي عامل نداشته باشد“ . 29
Flocking behavior حرکت گله ایيكي از انواع رفتارهاي اجتماعي •عامل• از بزرگ!ي ي!ك گروه ب!ا يكس:ان ه!ا در هدف هم ب!ا
فاصله مشخص ها در يك . در اين رفتار همه عاملاند تعامليكس:ان ب!ا و س:رعت موانع ب!ا برخورد از و كرده حرك!ت
كنند. يكديگر خودداري ميكاربردها:•سنسورهاي • از بزرگ!ي گروه از اس!تفاده ب!ا محي!ط پاي!ش
متحرك تحويل موازي بار به مقصد• انجام عمليات امداد و نجات•
30
Coverage كنترل پوشش Control
:هدف• انجام در مناسب همپوشان!ي! ايجاد يك وظيفه ه!مگاني است
بندي ثابت مشابه آرايش•تفاوت : ه!دف پوشش محيط است و تأكيدي •
بر روي آرايش وجود ندارد
31
Consensusاجماع
رس!يدن هم!ه عامل ه!ا ب!ه ي!ك حال!ت واحد و يكسان و ايجاد هماهنگي بين آنها
32
RHCحل مساله آرایش بندی با Why RHC?- Generality: generic state & control cons.
- Reconfigurability: redefine functions & cons. To reflect changes
Why not RHC?- Computational demand- Theoretical Conservation: proofs of stability
33
RHCتوزیع شده راه حل غیر متمرکز مزایای زیر را دارد:
خودمختاری زیرسیستم ها حفظ می شود.•• scalableخودمختاری عام!ل ه!ا حف!ظ م!ی شود و نتیجه
قابل گسترش به تعداد زیادی عامل است. توزی!ع شده: در تئوری فق!ط یک RHCمشک!ل
راه ح!ل متمرک!ز، پایداری مجانب!ی را تضمین می کند.
34
RHCحل مساله آرایش بندی با یک • و شود م!ی! تعری!ف مناس!بی! هدف تاب!ع
نهایی ه!دف تحق!ق برای بهین!ه کنترل مس!اله در ها ربات هماهنگ!ی! و بندی آرای!ش یعن!ی قال!ب کنترل پی!ش بی!ن مبتن!ی بر مدل ح!ل می
شود.هدف ای!ن اس!ت ک!ه ب!ا اس!تفاده از روش! افق •
سوی ب!ه را ه!ا عام!ل از گروه!ی! بی!ن پی!ش هدف مشترکی هدایت کرده و پایدار کنیم.
•35
قیود در سیستم های چندعاملی ممکن قیود دارند. دینامی!ک ی!ک ه!ر ه!ا عام!ل
اس!ت برای ه!ر ی!ک از عام!ل ه!ا به طور فردی کنترلی محدود ورودی مثال باش!د داشت!ه وجود
برای هر عامل. دس!ته دیگری از قیود وجود دارن!د ک!ه! مربوط به
ذات سیستم هستند. مثال قید نانهولونومیک بس!ته ب!ه هدف!ی ک!ه تعری!ف شده ب!ه وجود می
ب!ا ه!م کوپ!ل م!ی کنند مثال آین!د و عام!ل ه!ا را قیود جلوگیری از تصادم.
36
معرفی سیستم و شرایط مسالهبرای هر عامل
37
حالت ها و کنترل
{1,..., }ai N
2( ) ( ( ), ( )) ni i iz t q t q t
( ) niu t
( ) ( ), 1,...,i i aq t u t i N
دینامیک هر یک به صورت زیر است
دینامیک خطی و همسان برای عامل ها
معرفی سیستم و شرایط مسالههر عامل تحت قیود ورودی و حالت زیر قرار دارد
38
( ) , ( ) , 0i iu t z t t U Z
ای!ن اس!ت ک!ه تمام!ی عام!ل ها هدف کنترل:ی به طور مجانبی و با همکاری یکدیگر به
ک!ه ی!ک نقط!ه تعادل معادل!ه دینامی!ک س!یستم است برسند
1( ,..., ) a
a
Nc c cNz z z Z
RHCمتمرکز همکاری عامل ها با مینیمم کردن تابع هزینه زیر •
تحقق می یابد
39
0
2 2 2 2
( , )( , ) i j ij di jL z u q q d q q q u
E
, , وزن های ثابت و مثبت 2
dq q هزینهTracking1 2 3( ) / 3c c c
dq q q q
1 2 3( ) / 3q q q q
RHCمتمرکز
در ای!ن مرحل!ه الزم اس!ت فرضیات!ی در نظ!ر گرفته شوند.
مثال اینکه تما!م حالت ها قابل اندازه گیری هستند.دینا!میک پیشروی برابر در انجام محاس!بات زما!ن
حلقه بسته قابل صرفنظر کردن است.
40
می توان تابع هزینه جمعی را به صورت 2معادل زیر نیز بنویسیم 2( , ) c
QL z u z z u
centralized open-loop optimalcontrol problem
41
*
( )
2
2
( ( ), ) min ( ( ), ( )) ( ( )),
( ) ( ), ( ) , ( ) , [ , ],( ; ( )) ( ),
( ) , 0
( ) : { : ( ) , 0}
a a
a
t T
ut
N N
c T
P
nN
J z t T L z u d G z t T
subject to
q s u s u s z s s t t Tz t T z t
whereG z z z P P and
z G z
U Z
RHCمتمرکز مسئله کنترل بهینه مورد نظر را در زمان
42
0t مقدار دهی اولیه می کنیم
دوره زمانی به روز شدن افق غلطکی*
0( ) ( ),centq u t سیستم حلقه بسته
قانون کنترل افق پیش بین متمرکز به صورت زیر است
* *( ) ( ; ( )), [ , ],0cent centu u z t t t T
RHCتوزیع شده ه!ر دو عامل!ی ک!ه ب!ا ه!م همکاری م!ی کنن!د همسایه
نامیده می شوند.
Gگراف تعامل بین عامل هاست
iبرای هر عامل
43
Decoupled integrated Cost
44
RHCتوزیع شده ه!ر عام!ل ب!ا دردس!ت داشت!ن حال!ت کنونی خود و •
همس!ایه های!ش مس!اله کنترل بهین!ه حلقه باز خود را حل می کند.
، کنترل مفروض iقب!ل از ه!ر آپدی!ت، ه!ر عامل •برای ه!ر کدام از همس!ایه های خو!د را دریافت
می کند.
45
RHC توزیع شده
46
RHC توزیع شده
47
Local compatibility constraint
این قید تضمین می کند که هیچ عاملی در مساله •بهینه سازی از آنچه که همسایه هایش از آن انتظار
دارند، خیلی فراتر نمی رود.
• Degree of consistency between what a vehicle plans to do and what neighbors believe that vehicle will plan to do
متناظر با توان دوم پریود آپدیت است.•48
Controller
49
پایداریهدف رساندن حالت ها به مبدا •
• Optimal Cost Function as Lyapunov function
• Terminal Constraints Terminal inequality constraint Terminal cost function
50
Dual-Mode RHC• Robustness to model uncertainty in the
presence of generic state constraints by making the constraints more conservative.
51
Centralized
52
Distributed
53
مقایسه روش هامحاسبات • ب!ه نس!بت شده توزی!ع محاس!بات برتری
موازی:بهینه • مس!اله ح!ل هنگام در شده توزی!ع روش در
سازی هیچ انتقال اطالعاتی بین عامل ها نیاز نیستبهینه • تکرار مس!اله در حی!ن بهین!ه س!ازی موازی در
سازی، مسائل با هم در ارتباطند.هزینه ارتباطی پایینتر•
54
مراجع1. Distributed Receding Horizon Control of Multi-agent Systems, William B. Dunbar,
California Institute of Technology Pasadena, California, 20042. Receding Horizon Control of Multi-Vehicle Formations: A Distributed Implementation,
William B. Dunbar, Richard M. Murray, Control and Dynamical Systems 107-81, California Institute of Technology, Pasadena, CA 91125, 2004 IEEE CONFERENCE ON DECISION AND CONTROL
3. Distributed Model Predictive Control By Eduardo Camponogara, Dong Jia, Bruce H. Krogh, and Sarosh Talukdar, Department of Electrical and Computer Engineering, Carnegie Mellon University, Pittsburgh, PA 15213, U.S.A, IEEE Control Systems Magazine
با 4. رقابت:ي محيط هاي در تقويت:ي يادگيري از اس:تفاده ب:ا عامل ه:ا آرايش بندي بازي جن::گ، در رس::اله ، دانشكده مهندس::ي برق، دانشگاه ص!!نعتي اميرك!!بيركاربرد