ده از ا ف ت س ا ا زگ ب ز ب از ي س ب ش کن زا بهاي گاه اي دز بکاوي و گ ل ا ل ح م و ي س ق ت زد ک ب زوFrequent Pattern Mining on Very Large Transaction Databases Using Divide-and-Conquer Approach ي ب را سه م ي ر ک مد ح م و: ج ش ب دا84131906 ) اد ي سا( روش ف از اده ب داله ز ي ع مد ح: ا ما ن هد زا ا ي س ا ر يO ب ک ر مي ا ي عت ت صاه گ ش ب دا ز ب و يX مپ کا ي س د ي ه م کده ش ب دا ت س ه بb ي ازد1391 رد خ وf ان د حوبh دا ام ح ه ب ب
123
Embed
دانشجو: محمد کريم سهرابي 84131906 استاد راهنما: احمد عبداله زاده بارفروش (استاد)
به نام خداوند جان و خرد. الگوکاوي در پايگاههاي تراکنش بسيار بزرگ با استفاده از رويکرد تقسيم وحل Frequent Pattern Mining on Very Large Transaction Databases Using Divide-and-Conquer Approach. دانشگاه صنعتي اميرکبير دانشکده مهندسي کامپيوتر. دانشجو: محمد کريم سهرابي 84131906 - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
الگوکاوي در پايگاه هاي تراکنش بسيار بزرگ با استفاده از رويکرد تقسيم
وحلFrequent Pattern Mining on Very Large
Transaction Databases Using Divide-and-Conquer Approach
دانشجو: محمد کريم سهرابي84131906
استاد راهنما: احمد عبداله زاده بارفروش )استاد(
دانشگاه صنعتي اميرکبير
دانشکده مهندسي کامپيوتر
1391ارديبهشت
به نام خداوند جان و خرد
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
4
تعريف مسالهالگو
مدل مشخصي از داده در پايگاه تراكنش )پايگاهداده(
مجموعه داده، هاساختارهای گوناگونی از داده( )... G،رشته، گراف
انواع الگوهاي مهم
مجموعه آيتم ها توالي هاگراف ها
5
تعريف مسالهمجموعه آيتم ها
I مجموعه همه آيتم هاي داده اي به كاررفته در پايگاه :تراكنش
مثال: در پايگاه داده فروشگاه: }نان، پنير، خامه، تخم= I مرغ{
مجموعه آيتم(itemset) هر زير مجموعه :X Iاز
}مثال: }نان، پنير X=
},...,,{ 21 miiiI
nn jjjjjj iiiiiiX ...},...,,{2121
6
تعريف مسالهتراكنش
:يك چندگانه به فرم تراكنشT=(tid, X)tidGشماره تراكنش :Xيك مجموعه آيتم :
تراكنش شامل مجموعه آيتمY : تراكنشT=(tid, X) كه در آن
:مجموعه چند تراكنشپايگاه تراكنش مجموعه پشتيباني تراكنشX (D(X)) : مجموعه
Xشماره سطرهاي تراكنش هاي شامل Sup(X) : تعداد تراكنش هاي موجود در مجموعه
Xپشتيباني
XY
|)}()),((|),{(|)( YXTDBYtidYtidXSUP
7
تعريف مسالهتراكنش
تراكنشفروشگاه با سه پايگاه تراكنش مثال: نمونه
شامل مجموعه آيتم }پنير{ 3 و 1تراكنش هاي شامل مجموعه آيتم }پنير، خامه{ 1تراكنش :}{1,3} مجموعه پشتيباني }پنير
tidItemsetپنير، خامه، نان1 تخم مرغ2نان، پنير3
8
تعريف مساله(frequency)تكرارشوندگي
آستانه زيربري(minsup) :حد آستانه مورد نظر كاربر :مجموعه آيتم مجموعه آيتم تكرارشوندهXبا شرط
مثال: به ازايminsup = 2پنير{: تكرارشونده{)پنير، خامه{: ناتكرارشونده )تكرارناشونده{
و الگوبه كار بردن واژه هاي به جاي هم در ارائهمجموعه آيتم
supmin)( XSUP
9
تعريف مساله(closed Pattern)الگوهاي بسته
: عدم وجود ابر الگويي از الگو با همان الگوي بستهمجموعه پشتيباني
:الگوي تكرارشونده و بستهالگوي تكرار شونده بسته مثال: }نان، پنير{: الگوي تكرارشونده بسته بر اساس
minsup=2 مثال: }خامه، پنير{: الگوي ناتكرارشونده بسته بر
minsup=2اساس
10
تعريف مسالهفرضيات مساله
كاوش الگوهاي تكرارشونده از پايگاهي)مثال: تراكنش هاي هم جنس از
تراكنش هاي فروش(
غير قطعي عدم وجود داده هاي خراب ودر پايگاه تراكنش
عدم تغيير و به روزرساني پايگاه تراكنشدر زمان الگوكاوي
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
12
رهيافت هاي جاري براي حل مسالهکاوش مجموعه آيتم هاي تكرارشونده
مجموعه آيتم I، 2^dموجود در آيتم dبه ازاي روش سردستي (Naïve)
ساخت همه مجموعه آيتم هاي ممكنتراکنش هاي موجود در پايگاه تراکنش همه با مقايسه آنها بر مجموعه آيتم مزبورمشتملتعداد تراکنش هاي شمارش تكرارشونده مجموعه آيتم هايمشخص نمودن
وعه آيتم هانماييمرتبهGتعداد مجم در آيتمهزارانامکان وجود Gمورد Gپايگاه تراکنش
استفاده
13
رهيافت هاي جاري براي حل مساله{A, B, C, D, E} آيتم 5شبکه اي از همه مجموعه آيتم هاي ممکن به ازاي
مثالي از شبکه بندي زيرمجموBعه اي
A B C D E
AB AC AD AE BC BD BE CD CE DE
ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE
ABCD ABCE ABDE ACDE BCDE
ABCDE
null
14
رهيافت هاي جاري براي حل مسالهانواع روش هاي كاوش بر اساس رويكرد
جستجو الگوريتم هاي اول سطح(Apriori)
شروع ازGنود راس شبکه مجموعه آيتم هاي کانديدتوليد Gهر سطح از مجموعه
آيتم هاي تكرار شونده سطح قبل ت تكرار شوندگيGآيتم هاي کانديدتس Gهر سطحمجموعه
الگوريتم هاي اول عمق(FP-Growth)ساخت درخت آيتم ها بر اساس پايگاه تراكنشجستجوي عمقي درخت
15
رهيافت هاي جاري براي حل مساله اصلApriori
عدم وجود ابرالگوي تكرارشونده از يک الگوي ناتكرارشونده الگوريتمApriori :
)يافتن الگوهاي تكرار شونده يك آيتمي )آيتم هاي تكرار شونده كانديد تكرارشوندگي ساخت مجموعه الگوهايk آيتمي از روي
آيتمي(k-1)مجموعه الگوهاي تكرار شونده تست تكرارشوندگي آنها با پويش پايگاه تراكنش
:Gيافتن مجموعه آيتم هاي تكرارشونده در پايگاه تراکنش مثالS=3 و با حد آستانه (TDB)زير
L1 مجموعه همه مجموعه :آيتمهاي تكرارشونده تک آيتمي
L1={a, b, c, f, m, p}
TidItemsets100f, a, c, d, g, i, m, p
200a, b, c, f, l, m, o
300b, f, h, g, o
400b, c, k, s, p
500a, f, c, e, l, p, m, n
16
رهيافت هاي جاري براي حل مساله
C2={ab,ac,af,am,ap,bc,bf,bm,bp,cf,cm,cp,fm,fp,mp}L2={ac, af, am, cf, cm, fm}C3={acf, acm, afm}L3={acf, acm, afm}
C4}{= L4}{=
TidItemsets(ordered) Frequent Itemsets100f, a, c, d, g, i, m, pa, c, f, m, p
200a, b, c, f, l, m, oa, b, c, f, m
300b, f, h, g, ob, f
400b, c, k, s, pb, c, p
500a, f, c, e, l, p, m, na, c, f, m, p
17
رهيافت هاي جاري براي حل مسالهApriori
معايبحجم بسيار زياد الگوهاي کانديد ايجاد –
شده در مقايسه با الگوهاي تکرار شونده )مرتبه نمايي(
پويش چندين باره پايگاه تراکنش )در هر –
مرحله يک پويش(
18
رهيافت هاي جاري براي حل مسالهFP-Growth
ساخت درختFP-Tree:- يک بار پويش پايگاه تراکنش به منظور يافتن 1
هاي تکرارشونده و مرتب کردن آيتم هاي آيتميافته شده بر اساس ترتيب نزولي تعداد تکرار
L={f:4, c:4, a:3, b:3, m:3, p:3} - مرتب کردن هر تراکنش بر اساس ترتيب 2
مشخص شده و حذف آيتم هاي تکرارناشونده از هر تراکنش
19
رهيافت هاي جاري براي حل مسالهFP-Growth
Item frequency f 4c 4a 3b 3m 3p 3
TID Items 100 {f, a, c, d, g, i, m, p}200 {a, b, c, f, l, m, o}300 {b, f, h, j, o}400 {b, c, k, s, p}500 {a, f, c, e, l, p, m, n}
TID Items (ordered) frequent items100 {f, a, c, d, g, i, m, p} {f, c, a, m, p}200 {a, b, c, f, l, m, o} {f, c, a, b, m}300 {b, f, h, j, o} {f, b}400 {b, c, k, s, p} {c, b, p}500 {a, f, c, e, l, p, m, n} {f, c, a, m, p}
20
رهيافت هاي جاري براي حل مسالهFP-Growth
{}
f:1
c:1
a:1
m:1
p:1
{f, c, a, m, p}{}
{}
f:2
c:2
a:2
b:1m:1
p:1 m:1
{f, c, a, b, m}
21
رهيافت هاي جاري براي حل مسالهFP-Growth
{}
f:4 c:1
b:1
p:1
b:1c:3
a:3
b:1m:2
p:2 m:1
{}
f:3
c:2
a:2
b:1m:1
p:1 m:1
{f, b}
b:1{c, b, p}
c:1
b:1
p:1
{}
f:3
c:2
a:2
b:1m:1
p:1 m:1
b:1{f, c, a, m, p}
22
رهيافت هاي جاري براي حل مسالهFP-Growth
{}
f:4 c:1
b:1
p:1
b:1c:3
a:3
b:1m:2
p:2 m:1
Header Table
Item head fcabmp
23
رهيافت هاي جاري براي حل مسالهFP-Growth
مزايا ساخته شدن درخت كامل با دو پويش بر
روي پايگاهفشرده سازي پايگاه تراكنش براي كاوش
24
رهيافت هاي جاري براي حل مسالهFP-Growth
به كار گيري درختFP-Tree براي الگوكاوي عمقي:
کاوشFP-treeبه روش تقسيم و حل {}
f:4 c:1
b:1
p:1
b:1c:3
a:3
b:1m:2
p:2 m:1
{}
f:4 c:1
b:1
p:1
fb:1fc:3
fa:3
fb:1fm:2
fp:2 fm:1
{}
f:4 c:1
b:1
p:1
fb:1fc:3
fca:3
fcb:1fcm:2
fcp:2 fcm:1
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
26
كارهاي مرتبطانواع الگوريتم هاي كاوش بر اساس
رويكرد جستجو
27
كارهاي مرتبطانواع الگوريتم هاي كاوش بر اساس رويكرد جستجو
28
كارهاي مرتبطانواع الگوريتم هاي كاوش بر اساس رويكرد جستجو
29
كارهاي مرتبطانواع الگوريتم هاي كاوش الگوهاي بسته
30
كارهاي مرتبطAlgorithmname
yearThe First Author
BFS/DFSTop-Down/Bottom-Up
Closed/Maximal/All/Colossal
Bit-wiseParallel horizontal/ vertical
Comments
Apriori1993AgarwalBFSBottom-UpAllNoNohorizontalThe first BFS Algorithm
DIC1997BrinBFSBottom-UpAllNoNohorizontal
FP-Growth2000HanDFSBottom-UpAllNoNohorizontalThe first DFS Algorithm
PFP-Tree2004JavedDFSBottom-UpAllNoYeshorizontalThe first DFS parallel method
LFP-Tree2007YuDFSBottom-UpAllNoYeshorizontal
PP-Tree2010TanbeerDFSBottom-UpAllNoYeshorizontal
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
32
رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي
منطق روش بيتيیک بودن وجود یک آیتم در یک تراکنش معادل –
صفر بودنبیت متناظر آن و عدم وجود معادل هر آیتم در پایگاه تراکنش، nدر صورت وجود –
بیتیnتراکنش یک رشته پایگاه تراکنش، mدر یک پایگاه تراکنش با –
بیتیm*nتراکنش معادل یک ماتریس در قالب آرایه مجموع یک های سطرها نگهداری –
rowsumدر قالب آرایه مجموع یک های ستونها نگهداری –
colsum
الگوریتم. 1-2شکل تکامل مراحل واره درخت
33
رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي
الگوریتم. 1-2شکل تکامل مراحل واره درخت
34
رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي
هرس کردن ماتریس بیتی آنها کمتر از colsumحذف همه ستونهایی که –
minsup.است پس از حذفrowsumاصالح مقادیر –
الگوریتم. 1-2شکل تکامل مراحل واره درخت
35
رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي
تعیین تکرارشوندگی یک الگو با استفاده ازماتریس بیتی:
الگوریتم. 1-2شکل تکامل مراحل واره درخت
cd تکرارشونده
و بقیه ناتکرارشون
دهبه ازای
minsup=3
36
رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي
:تعيين بسته بودن الگوها-
الگوریتم. 1-2شکل تکامل مراحل واره درخت
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
38
الگوكاوي سريالرويكرد هاي كاوش افقي و عمودي
:رویکرد افقی هر پایگاه تراکنش شامل تعدادی تراکنش )سطرهاي
پايگاه تراكنش( هر تراكنش شامل تعدادی آیتم
الگوریتم. 1-2شکل تکامل مراحل واره درخت
39
الگوكاوي سريالرويكرد هاي كاوش افقي و عمودي
:ديGرویکرد عمو نگهداري آیتم ها بر اساس مجموعه تراکنش
هایی )شماره تراکنش هايي( که دارای آن آيتم هستند
:مثال {c, 1,2,4}{ d, 1,2,3,4 }
پايگاه هاي تراكنش ابعاد باال (high dimensional)
الگوریتم. 1-2شکل تکامل مراحل واره درخت
40
الگوكاوي سريالرويكرد هاي كاوش افقي و عمودي
:رویکرد عمودي درخت عمودي از پايين به باالدرخت عمودي از باال به پايين
الگوریتم. 1-2شکل تکامل مراحل واره درخت
41
الگوكاوي سريالرويكرد هاي كاوش افقي و عمودي
:درخت عمودي از پايين به باال
الگوریتم. 1-2شکل تکامل مراحل واره درخت
42
الگوكاوي سريالرويكرد هاي كاوش افقي و عمودي
:درخت عمودي از باال به پايين
الگوریتم. 1-2شکل تکامل مراحل واره درخت
43
الگوكاوي سريالHPMالگوكاوي بيتي افقي : :رابطه شمول تعريفx: :افراز هر مجموعه از الگوهاي تكرارشونده به دو قضيه
xمجموعه بر اساس آيتم :تقسيم خروجي )مجموعه الگوهاي تكرارشونده( به نتيجه
nدسته nتعداد آيتم هاي تكرارشونده موجود در پايگاه تراكنش :
فرض: مجموعه مرجعI شامل n+m آیتم n آیتم تکرار شونده m ناتکرارشونده آیتم
I={a1,a2,..,an,an+1,…,an+m}
الگوریتم. 1-2شکل تکامل مراحل واره درخت
)()(: QPxQPxQPx
44
الگوكاوي سريالHPMگوكاوي بيتي افقيGال :: مجموعه همه الگوهای تکرارشونده قابل کاوشالگوهای تکرار شونده مشتمل بر آیتمدسته اول :a1 .الگوهای تکرار شونده مشتمل بر آیتمدسته دوم : a2 و فاقد
a1 آیتم
الگوهای تکرار شونده مشتمل بر آیتمدسته سوم : a3 و فاقدa2 و a1 آیتم
... دسته(n-1)الگوهای تکرار شونده مشتمل برام : an-1 و فاقد
نباشند. an-2 و... و a2 و a1 آیتم هایدستهnالگوهای تکرار شونده مشتمل بر آیتمام : an باشند ولی
نباشند)یعنی الگوی تك an-1 و... و a2 و a1 حاوی آیتم های(. anآيتمي
الگوریتم. 1-2شکل تکامل مراحل واره درخت كاوش الگوهاي بسيار بزرگ با گذر از
الگوهاي كوچكتر
109
نتايج آزمايشات مجموعه دادهpumsb
الگوریتم. 1-2شکل تکامل مراحل واره درخت كاوش الگوهاي بسيار بزرگ با گذر از
الگوهاي كوچكتر
110
نتايج آزمايشات مجموعه دادهAccident
الگوریتم. 1-2شکل تکامل مراحل واره درخت كاوش الگوهاي بسيار بزرگ با گذر از
الگوهاي كوچكتر
111
نتايج آزمايشات مجموعه دادهRetail
الگوریتم. 1-2شکل تکامل مراحل واره درخت كاوش الگوهاي بسيار بزرگ با گذر از
الگوهاي كوچكتر
112
نتايج آزمايشات مجموعه دادهkosarak
الگوریتم. 1-2شکل تکامل مراحل واره درخت كاوش الگوهاي بسيار بزرگ با گذر از
الگوهاي كوچكتر
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
114
نتيجه گيري و كارهاي آيندهدست یابی به دستاوردهای زیر در زمینه الگوکاوی1 کاوش کارآمد مجموعه کامل الگوهای تکرارشونده )
با ارائه الگوریتم سریال با رویکرد افقی به صورت HPM.
2 کاوش کارآمد مجموعه کامل و بسته الگوهای )سریال با رویکرد از عمودی با تکرارشونده به صورت BUMبا ارائه الگوریتم دیدگاه از پایین به باال
3 کاوش کارآمد مجموعه کامل و بسته الگوهای )سریال با رویکرد از عمودی با تکرارشونده به صورت
.TDM با ارائه الگوریتم دیدگاه از باال به پايين
الگوریتم. 1-2شکل تکامل مراحل واره درخت
115
نتيجه گيري و كارهاي آيندهدست یابی به دستاوردهای زیر در زمینه الگوکاوی4 طراحی بستر مناسب برای مدل سازی مساله )
الگوکاوی به محاسبات موازی شونده توسط آرایه های سیستالیک با به کار گیری ماتریس بیتی و تقسیم مناسب
آن بر روی پردازنده ها.5 اعمال قابلیت تقسیم وحل در موازی سازی الگوکاوی )
دو ارائه روش موازی و مبتنی بر آرایه های سیستالیکو برای الگوکاوی. SABMAبعدی
6 کاوش الگوهای بسیار بزرگ ( ارائه روشی کارآمد برای، بدون نیاز به زمینه بدون کاوش الگوهای کوچکتر
محاسباتی پیچیده و بدون از دست داده قطعیت در . BVBUCمجموعه الگوهای کاوش شده و ارائه الگوريتم
الگوریتم. 1-2شکل تکامل مراحل واره درخت
116
نتيجه گيري و كارهاي آيندهبرخي دستاوردهای پژوهشي رساله1:به كارگيري روش هاي الگوكاوي در مسائل كاربردي )
افزايش كارايي پرس و جوهاي پايگاه داده مقاله علمي پژوهشي: ”“ پذيرفته و تحليلي با نگاشت مكعب مفهومي به فضاي دوبعدي
چاپ شده در مجله مهندسي برق و كامپيوتر ايران
2ارائه روش از پايين به باالي عمودي )كاوي در پايگاه هاي تراكنش با ابعاد باال بر الگومقاله كنفرانس: ”
پذيرفته و اساس رويكرد شمارش از پايين به باالي ماتريس بيتي“ ارائه شده دركنفرانس انجمن كامپيوتر ايران
3 به كارگيري روش پايين به باالي عمودي در كاوش الگوهاي بسيار بزرگ )بدون كاوش الگوهاي كوچك و مياني
ISI: “Efficient colossal pattern mining in highمقاله مجله dimensional datasets” پذيرفته شده و چاپ شده در مجلهKnowledge
based Systems (Knosys) از سري مجالت elsevier
الگوریتم. 1-2شکل تکامل مراحل واره درخت
117
نتيجه گيري و كارهاي آيندهبرخي دستاوردهای پژوهشي رساله4ارائه روش افقي مبتني بر ماتريس بيتي )
ISI: “EFFICIENT FREQUENT PATTERN MINING USING BITمقاله مجله MATRIX BASED REPRESENTATION OF DATASET” بازبيني شده و در
International Journal of Software Engineeringشرف پذيرش در مجله and Knowledge Engineering
5موازي سازي الگوكاوي با استفاده از آرايه هاي سيستاليك ) ISI: “PARALLEL FREQUENT ITEMSET MINING USINGمقاله مجله
SYSTOLIC ARRAYS” در دست داوري در مجلهKnowledge based Systems (Knosys) از سري مجالت elsevier
6 بررسي روش هاي جاري الگوكاوي و دسته بندي آنها بر اساس رويكردي )جديد و چهارسطحي
در دست داوري ”ISI: “A taxonomy of frequent pattern miningمقاله مجله International Journal of Knowledge Managementدر مجله
الگوریتم. 1-2شکل تکامل مراحل واره درخت
118
نتيجه گيري و كارهاي آيندهكارهاي آينده
فشرده سازی ماتریس بیتی در مواردی که ماتریستولید شده تنک باشد و شامل تعداد زیادی بیت صفر.
اعمال موازی سازی در الیه های زیرین و مراحل بعدیروش تقسیم و حل و ایجاد ابعاد بعدی برای آرایه
سیستالیک.
اعمال موازی سازی بر روي روش های عمودی ارائهشده با به کارگیری آرایه های سیستالیک.
الگوریتم. 1-2شکل تکامل مراحل واره درخت
فهرست مطالبتعريف مسالهرهيافت هاي جاري براي حل مسالهكارهاي مرتبط رويكرد بيتي در بسترسازي براي حل مساله الگوكاوي الگوكاوي سريال )افقي- عمودي از پايين به باال- عمودي
از باال به پايين( الگوكاوي موازي كاوش الگوهاي بسيار بزرگ با گذر از الگوهاي كوچك و
متوسطنتيجه گيري و كارهاي آيندهمراجع
120
مراجع
الگوریتم. 1-2شکل تکامل مراحل واره درخت
M.K. Sohrabi, A.A. Barforoush, Efficient colossal pattern mining in high dimensional datasets, Knowledge Based Systems (2012), http://dx.doi.org/10.1016/j.knosys.2012.03.003
Agrawal R, Imielinski T, Swami A (1993) Mining association rules between sets of items in large databases. In: Proceedings of the 1993ACM-SIGMOD international conference on management of data (SIGMOD’93), Washington, DC, pp 207–216.
Agrawal R. and Srikant R. “Fast algorithms for mining association rules.” In Proc. 1994 Int. Conf. Very Large Data Bases (VLDB’94), pages 487–499, Santiago, Chile, Sept. 1994.
Mannila H., Toivonen H., Verkamo AI (1994) Efficient algorithms for discovering association rules. (KDD'94) Seattle, WA, pp 181-192.
Han J, Pei J, Yin Y (2000) Mining frequent patterns without candidate generation. In: Proceeding of the 2000 ACM-SIGMOD international conference on management of data (SIGMOD’00), Dallas, TX, pp 1–12
Agarwal R, Aggarwal CC, Prasad VVV (2001) A tree projection algorithm for generation of frequent itemsets. J Parallel Distribut Comput 61:350–371
121
مراجع
الگوریتم. 1-2شکل تکامل مراحل واره درخت
Liu J, Pan Y, Wang K, Han J (2002) Mining frequent item sets by opportunistic projection. In: Proceeding of the 2002 ACM SIGKDD international conference on knowledge discovery in databases (KDD’02), Edmonton, Canada, pp 239–248
Grahne G, Zhu J (2003) Efficiently using prefix-trees in mining frequent itemsets. In: Proceeding of the ICDM’03 international workshop on frequent itemset mining implementations (FIMI’03), Melbourne, FL, pp 123–132G. Buehrer, S. Parthasarathy, S. Tatikonda, T. Kurc and J. Saltz, "Toward terabyte pattern mining an architecture-conscious solution," in PPoPP , 2007, p. 2-12.
D. Chen, C. Lai, W. Hu, W.G. Chen, Y. Zhang and W. Zheng, "Tree partition based parallel frequent pattern mining on shared memory systems," in IEEE Parallel and Distributed Processing Symposium , 2006.
S. K. Tanbeer ,C. F. Ahmed ,B.-S. Jeong" ,Parallel and Distributed Algorithms for Frequent Pattern Mining in Large
Databases", IETE technical review, 2010. J. Dong, M. Han, BitTableFI: an efficient mining frequent itemsets algorithm, Knowledge Based Systems 20 (4) (2007) 329–335 W. Song, B. Yang, Z. Xu, Index-BitTableFI: An improved algorithm for mining frequent itemsets, Knowledge Based Systems 20 (4) (2007) 329–335
Z. Xu, D. Gu, S. Wei, An Efficient Matrix Algorithm for Mining Frequent Itemsets, (2009) International Conference on Computational Intelligence and Software Engineering, 2009. CiSE 2009. Schlegel B., Gemulla R., Lehner w. (2011) Memory-Efficient Frequent Itemset Mining, in: Proc. 14th International Conference on Extending Database Technology (EDBT), 2011.
بيان فرمال مسائل با استفاده از ارائه تعاريف و قضايايجديد
بررسي دقيق تر سابقه به كارگيري آرايه هاي سيستاليك درپايگاه هاي داده و داده كاوي
تكميل و ارائه دقيق تر مفروضات مساله در ابتداي ارائهبيان پيچيدگي زماني روش هاي ارائه شده در ارائه كامل كردن نتايج آزمايشات با ارائه تحليل نتايج و بيان تاثير
پارامترهاي پايگاه هاي داده بيان دقيق نوآوري هاي رساله در ارائه و جداسازي آنها از
كارهاي پيشين ارائه مراجع مورد استفاده جديدتر در ارائهويرايش اماليي و انشايي پايان نامه افزودن دستاوردهاي پژوهشي و مقاالت مستخرج از رساله
به ارائهدسته بندي اساليدها و كاهش حجم اساليدهاي ارائه