High performance GPU based Master : Dr. Ghaderi Mohammad Amin Amjadi Winter 2015
High performance GPU based
Master :Dr. Ghaderi
Mohammad Amin Amjadi
Winter 2015
2
مقاله پایهHigh performance GPU based optimized feature matching forcomputer vision applications
Kajal Sharma
2015 Elsevier B.V. All rights reserved
3
مطالب
مقدمه1.
بیان مسئله2.
اهداف کلی3.
پیشینه4.
بیان طرح5.
نتایج6.
نتیجه گیری7.
پیشنهادات8.
CPUنگاه کلی به تاریخچه معماری
PipeL
ine
Super Scalar
Multi ProcessorMulti
Core
محدودیت های ساخت و طراحیسعی در افزایش همروندی و همزمانی
4
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
CPU
GPU
نسبت به پیشرفت بیشتری و صنعت بازی سازی، محدودیت کمتر پردازنده های گرافیکی بدلیلCPU داشته است
پهنای باند باالحافظه با دستورات عام منظورهمجموعه جهت افزایش سرعت برنامه های عام منظوره می باشدپردازنده کمکی قدرتمند دارای یک از استانداردهایIEEE پشتیبانی می نمایددو -دقتی و تک-دقتی اعداد ممیز شناور
تک-دقتیدو-دقتی
5
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
(−1 )𝑏31∗ (1 .𝑏22𝑏21…𝑏0 ) 2∗2𝑒−127(−1 )𝑏 63∗ (1 .𝑏51𝑏50…𝑏0 ) 2∗2
𝑒− 1023
CPU vs GPU
6
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
جناب برنامه
GPGPUgeneral purpose graphics processing unit
GPU در مقابل CPU:CPUموازی سازی بیشتر نسبت به
CPUسرعت باالتر نسبت به استCPUرشد پردازشی پردازنده های گرافیکی بیشتر از
با توجه به معیار کارایی به قیمت، ارزان تر هستندبا توجه به معیار کارایی به وات، توان مصرفی کمتری دارند
GPGPU: جهت اجرای برنامه های عام منظورهGPUتکنولوژی استفاده از
7
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
تطبیق دو عکس
8
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
تطبیق دو عکس
9
پیدا نمودن نقاط کلیدیتطبیق دو عکس بر اساس نقاط کلیدی
(چرخش، تغییر مقیاس و اندازه، مات شدنامکان تطبیق در شرایط مختلف )پیاده سازی با سرعتی باال
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
1 .Schmid and Mohr
10
استفاده از گوشه یابیبرای حالت چرخش تصویر مناسب است
برای حالت تغییر مقیاس تصویر کارآمد نیست
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
2. Lowe
11
SIFT: scale invariant feature transform: تبدیل ویژگی مقیاس نابستهمناسب برای چرخش و تغییر مقیاس تصویر
زمان پردازش و محاسبه باال
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
3. SOMSelf Organizing Map
12
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
SIFT & SOM
13
ثانیه0.03576 تطبیق در SOM، 28الگوریتم ثانیه0.05773 تطبیق در SIFT، 16الگوریتم
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
الگوریتم هدف
14
جهت تسریعGPU و استفاده از آن بر روی SOMبهینه سازی الگوریتم استفاده از الگوریتم های عصبی )الگوریتم های رقابتی(
مقدمه مسئله اهداف پیشینه پیشنهادی روش نتایج نتیجه گیری پیشنهادات
الگوریتم هدف
o30 پردازندهMultiProcessoro 8هر پردازنده ،Thread را بصورت موازی اجرا
می نمایدoThread :های یک پردازنده synchronouslyo :پردازنده هاasynchronously
15
Element 0Element 1
…Element 7
Stream multiprocessor
Stream Processor
Stream Processor
SIMD
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
الگوریتم
16
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
نتایج
17
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
ارزشیابی
18
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
زمان محاسبات
19
مقدمه مسئله اهداف پیشینه پیشنهادی روش نتایج نتیجه گیری پیشنهادات
نتیجه گیری
20
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
متد جدید برای تطبیق سرعت باالتر: با استفاده از شبکه های عصبی وgpuنتایج نشان داده اند که الگوریتم در شرایط مختلف تصویر عملکرد مناسبی داردکاهش زمان محاسبات
پیشنهادات
21
مقدمه مسئله اهداف پیشینه روش پیشنهادی نتایج نتیجه گیری پیشنهادات
استفاده از الگوریتم های شبکه عصبی سریع تر1.
جهت افزایش سطح همزمانیMultiGPU استفاده از 2.
بردهGPUبا بهبودسازی الگوریتم، محاسبات بیشتری را سمت 3.
به عنوان پردازنده کمکی، و بهینه سازی آن براساس الگوریتمGPU در داخل FPGAاستفاده از 4.
اجرای همزمان چندین الگوریتم 5.
22
Question ?
☻Thanks☻