-
T.C.
GAZOSMANPAA NVERSTES
SALIK BLMLER ENSTTS
LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI
(YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)
YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR
UYGULAMA
Hazrlayan
Yunus Emre Kuyucu
Biyoistatistik Anabilim Dal
Yksek Lisans Tezi
Danman
Yrd. Do. Dr. nal Erkorkmaz
Tokat-2012
-
T.C.
GAZOSMANPAA NVERSTES
SALIK BLMLER ENSTTS
LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI
(YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)
YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR
UYGULAMA
Hazrlayan
Yunus Emre Kuyucu
Biyoistatistik Anabilim Dal
Yksek Lisans Tezi
Danman
Yrd. Do. Dr. nal Erkorkmaz
Tokat-2012
-
LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI
(YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)
YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR
UYGULAMA
Tezin Kabul Edili Tarihi: 04/01/2012
Jri yeleri (Unvan, Ad Soyad) mzas
Prof. Dr. Hafize SEZER(Bakan)
Yrd. Do. Dr. nal ERKORKMAZ(ye, Danman retim yesi)
Yrd. Do. Dr. lker ETKAN(ye)
Bu tez, Gaziosmanpaa niversitesi Salk Bilimleri Enstits Ynetim
Kurulunun
//. tarih ve . sayl oturumunda belirtilen jri tarafndan
kabul edilmitir.
Do. Dr. Hseyin ZYURT Mhr
Enstit Mdr mza
-
T.C.
GAZOSMANPAA NVERSTES
SOSYAL BLMLER ENSTTS MDRLNE
Bu belge ile bu tezdeki btn bilgilerin akademik kurallara ve
etik ilkelere
uygun olarak toplanp sunulduunu, bu kural ve ilkelerin gerei
olarak, almada bana
ait olmayan tm veri, dnce ve sonulara atf yaptm ve kaynan
gsterdiimi
beyan ederim.
04/01/2012
Tezi Hazrlayan rencinin
Ad ve Soyad
Yunus Emre KUYUCU
mzas
-
TEEKKRBu tezin hazrlanmas aamasnda yardmlarn esirgemeyen, bana
almamn
her aamasnda deneyim ve bilgileri ile yol gsteren danman hocam
Yrd. Do. Dr.
nal ERKORKMAZ a, hocam Yrd. Do. Dr. lker ETKAN a, sevgisi ve
destei ile
hep yanmda ve kalbimde olan eim Nagehan KUYUCU ya, biricik
yavrumuz Elif Naz
KUYUCU ya ve desteklerinden dolay tm aileme teekkr ediyorum.
-
iZET
Lojistik Regresyon Analizi (LRA), Yapay Sinir Alar (YSA) ve
Snflandrma ve Regresyon Aalar (C&RT) Yntemlerinin
Karlatrlmas ve Tp Alannda Bir Uygulama
Lojistik Regresyon, baml deikenin kategorik ve bamsz
deikenlerin
kark lekli olmas durumunda belirli bir dalm varsaymna baml
kalmakszn
baml deiken ile bamsz deikenler arasndaki neden-sonu
ilikisinin
belirlenmesinde kullanlan bir yntemdir.
Yapay Sinir Alar, insan beynindeki sinir alar gibi alarak son
derece
karmak yapya sahip problemlerin zmn salar. Kulland geriye
yaylma
algoritmasn ile a hatasn minimize ederek birimlerin en az hata
ile snflarna
atanmas iin an arlklarn hesaplar.
Snflandrma ve Regresyon Aalar (C&RT); ikili karar aac
oluturan bir
yntemdir. Aataki her bir noda, her bir bamsz deiken iin geliim
skoruna dayal
olarak en iyi kesim noktas ya da en iyi kategori gruplar
oluturulur.
Bu tez almasnda, Lojistik Regresyon Analizi (LRA), Yapay Sinir
Alar
(YSA) ve Snflandrma ve Regresyon Aalar (C&RT) Yntemlerinin
snflandrma
zelliklerinin karlatrlmas yaplmtr. Bu karlatrma iin prostat
kanseri
ynnden deerlendirilmesi yaplan hastalara ait veriler kullanlm,
ynteme gre
elde edilen sonular baar ynnden deerlendirilmitir.
Anahtar kelimeler: Lojistik Regresyon Analizi (LRA), Yapay Sinir
Alar (YSA),
Snflandrma Ve Regresyon Aalar (C&RT), Prostat Kanseri.
-
ii
ABSTRACT
Comparison of Logistic Regression Analysis (LRA), Artificial
Neural
Networks (ANN) and Classfication and Regression Trees
(C&RT)
Methods And An Aplication In Medicine
Logistic regression, categorical dependent variable and
independent variables in
the case of mixed-scale without being dependent on the
assumption that a certain
distribution of cause-effect relationship between the dependent
variable and
independent variables used in the determination of a method.
Artificial Neural Networks, such as neural networks working in
the human brain
is extremely complex structure provides the solution of
problems. Error back
propagation algorithm uses the network by minimizing the weight
of the units of the
network accounts for the appointment of classes with fewer
errors.
Classification and Regression Trees (C & RT) is a method of
forming a binary
decision tree. Each node in the tree, each independent variable
on the basis of the best
cut-off point score for the development or the best category
groups are created.
In this thesis, Logistic Regression Analysis (LRA), Artificial
Neural Networks
(ANN) and Classification and Regression Trees (C & RT)
characteristics of the
classification methods were compared. This comparison of the
data used in patients
undergoing evaluation for prostate cancer in terms of the three
methods to the results
obtained were evaluated in terms of success.
Key words: Logistic Regression Analysis (LRA), Artificial Neural
Networks (ANN),
Classfication and Regression Trees (C&RT), Prostate
Cancer.
-
iii
NDEKLER
ZET
ABSTRACT
NDEKLER
TABLOLAR LSTES V
EKLLER LSTES V
KISATMALAR VE SMGELER X
1. GR VE AMA 1
2. GENEL BLGLER 7
2.1. SINIFLAMA VE REGRESYON MODELLER 82.1.1. Karar Aalar 92.1.2.
Yapay Sinir Alar 18
2.1.2.1. Yapay Sinir A Nedir? 192.1.2.2. Biyolojik Sinir Alar
242.1.2.3. Yapay Sinir Alarnda Genel Yap 262.1.2.4. Yapay Sinir
Hcresi 272.1.2.5. Yapay Sinir Ann Temel Elemanlar 29
2.1.2.5.1. Giriler 302.1.2.5.2. Arlklar 302.1.2.5.3. Toplama
levi 312.1.2.5.4. Etkinlik levi (Aktivasyon Fonksiyonu)
322.1.2.5.5. k levi 38
2.1.2.6. A Girilerinin Hesaplanmas in Matris arpma Metodu
382.1.2.7. Yapay Sinir Hcresinin alma Prensibi 39ekil 2.17da
girileri ve arlklar verilmi olan bir yapay sinir hcresininalmas
yledir: 39
2.1.3. Lojistik Regresyon Analizi 422.1.3.1. Lojistik Snflandrma
ve Lojistik Regresyon Modeli 44
2.2. PROSTAT KANSER 472.2.1. Prostat Kanseri Hakknda Genel Bilgi
472.2.2. Prostat Nedir? 47
-
iv
2.2.3. Tehis 482.2.3.1. Prostatn Parmakla Muayenesi 482.2.3.2.
Prostata zg Antijenin Belirlenmesi (PSA) 482.2.3.3. Makattan
(rektum) Ultrason Muayenesi (TRUS) 49
3. GERE VE YNTEM 50
3.1. C&RT ALGORTMASI (Classification And Regression Trees:
Snflama VeRegresyon Aalar) 51
3.1.1. Maksimum Aacn Oluturulmas 52
3.2. YAPAY SNR AI MODELLER 553.2.1. Tek Katmanl Alglayclar
55
3.2.1.1. Hebb Kural 563.2.1.2. Perseptron 57
3.2.1.2.1. Perseptron Algoritmas 583.2.1.2.2. Delta 61
3.2.2. ok Katmanl Alglayclar 613.2.2.1. Geriye Yaylm Algoritmas
633.2.2.2. Standart Geriye Yaylm Eitim Algoritmas 64
3.2.2.2.1. Geriye Yaylm Algoritma eitleri 653.2.2.2.2. Geri Yaym
Mant 66
3.3. LOJSTK REGRESYON MODEL 693.3.1. Lojistik Regresyon
Modelinin Oluturulmas 693.3.2. oklu Lojistik Regresyon Modeli
713.3.3. oklu Lojistik Regresyon Modelinin Kurulmas 723.3.4.
Lojistik Regresyon Modelinde Katsaylarn Yorumlanmas 723.3.5.
Modelde kiden Fazla Bamsz Deikenin Olduu Durum 73
3.4. YNTEMLERN KARILATIRILMASI N LTLER 73
3.5. WEKA 75
4. BULGULAR 78
4.1. TANIMLAYICI STATSTKLER 78
4.2. LOJSTK REGRESYON ANALZ 81
4.3. SINIFLANDIRMA VE REGRESYON AALARI 86
4.4. YAPAY SNR ALARI 93
-
v4.5. YNTEMLERN KARILATIRILMASI 99
5. TARTIMA VE SONU 100
KAYNAKLAR 104
EKLER 111
Ek 1. 111
-
vi
TABLOLAR LSTES
Sayfa
Tablo 2.1. Biyolojik Sinir Hcresi 25
Tablo 2.2. statistiksel Yntemler le Yapay Sinir
AlarnnBenzeimi
26
Tablo 2.3. Toplama Fonksiyonu rnekleri Toplama levi 32
Tablo 2.4. Yaa zg Normal Serum PSA Deerleri 49
Tablo 4.1. Srekli Deikenler (Ya ve PSA) in Tanmlaycstatistikler
(n=236)
78
Tablo 4.2. Kategorik Deikenler (Rektal Tue ve Genetik Yatknlk)in
tanmlayc statistikler (n=236)
78
Tablo 4.3. Prostat Kanseri Tans Durumuna Gre SrekliDeikenlerin
(Ya ve PSA) Dalm
79
Tablo 4.4. Prostat Kanseri Tans Durumuna Gre
KategorikDeikenlerin (Rektal Tue ve Genetik Yatkn.) Dalm
80
Tablo 4.5. Odds Oranlar (LRA) 82
Tablo 4.6. Snflandrma Sonular-I (LRA) 82
Tablo 4.7. Snflandrma Sonular-II (LRA) 82
Tablo 4.8. Dzensizlik Matrisi Sonular (LRA) 83
Tablo 4.9. Snflandrma Sonular-I (C&RT) 86
Tablo 4.10. C&RT Snflandrma Sonular-II (C&RT) 86
Tablo 4.11. Dzensizlik Matrisi Sonular (C&RT) 87
Tablo 4.12. Snflandrma Sonular-I (YSA) 93
Tablo 4.13. YSA Snflandrma Sonular-II (YSA) 93
-
vii
Tablo 4.14. Dzensizlik Matrisi Sonular (YSA) 94
Tablo 4.15. Dm 0 in Arlklar 94
Tablo 4.16. Dm 1 in Arlklar 95
Tablo 4.17. Dm 2 in Arlklar 95
Tablo 4.18. Dm 3 in Arlklar 95
Tablo 4.19. Dm 4 in Arlklar 96
Tablo 4.20. Genel Karlatrma Tablosu 99
-
viii
EKLLER LSTES
Sayfa
ekil 2.1. Veri Madencilii Modelleri 7
ekil 2.2. Karar Aac Yaps 14
ekil 2.3. Basit Bir Yapay Nron 22
ekil 2.4. Basit Bir Yapay Sinir A 23
ekil 2.5. Biyolojik Sinir Sisteminin Blok Gsterimi 24
ekil 2.6. Biyolojik Sinir Hcresi 24
ekil 2.7. Yapay Sinir Alarnn Genel Yaps 26
ekil 2.8. Basit Alglayc Modeli 28
ekil 2.9. Dorusal veya Lineer Fonksiyon 33
ekil 2.10. Basamak Fonksiyonlar 34
ekil 2.11. Tek kutuplamal Basamak Fonksiyonu 35
ekil 2.12. ift Kutuplamal Basamak Fonksiyonu 35
ekil 2.13. Paral Dorusal Fonksiyon 36
ekil 2.14. Sigmoid Tipli Fonksiyon 37
ekil 2.15. Tanjant Hiperbolik Tipli Fonksiyon 37
ekil 2.16. Sins Tipli Fonksiyon 38
ekil 2.17. Yapay Sinir Ann alma rnei 40
-
ix
ekil 2.18. YSA de Kullanlan Geri Yaylml renmeAlgoritmas
41
ekil 3.1. Tek Arlk Katmanl Bir Yapay Sinir A 56
ekil 3.2. Basit Bir Perseptron Mimarisi 59
ekil 3.3. Tek Gizli Katmanl leri Beslemeli ok Katmanl BirYapay
Sinir A
62
ekil 3.4. ok Katmanl Alglayc 63
ekil 3.5. Tek Gizli Katmanl leri Beslemeli ok Katmanl BirYapay
Sinir A
64
ekil 3.6. Geri Yaym Mant 67
ekil 4.1. Rektal Tue sonularnn dalm 79
ekil 4.2. Genetik Yatknlk sonularnn dalm 79
ekil 4.3. Prostat Kanseri Tans Koyulan Hastalarn Rektal
TueSonular
80
ekil 4.4. Prostat Kanseri Tans Konulmayan (Normal)
HastalarnRektal Tue Sonular
80
ekil 4.5. Prostat Kanseri Tans Koyulan Hastalarn GenetikYatknlk
Durumlar Dalm
81
ekil 4.6. Prostat Kanseri Tans Konulmayan (Normal)
HastalarnGenetik Yatknlk Durumlar Dalm
81
ekil 4.7. LRA in ROC Erisi 83
ekil 4.8. Ya in Yanl Snflandrmalarn Gsterimi (LRA) 84
ekil 4.9. PSA in Snflandrma Hatalarnn Gsterimi (LRA) 84
ekil 4.10. Rektal Tue in Snflandrma Hatalarnn Gsterimi(LRA)
85
ekil 4.11. Genetik Yatknlk in Snflandrma HatalarnnGsterimi
(LRA)
85
ekil 4.12. C&RT in ROC Erisi 87
-
xekil 4.13. C&RT - Algoritmas in Aa Gsterimi 90
ekil 4.14. Ya in Yanl Snflandrmalarn Gsterimi (C&RT) 91
ekil 4.15. PSA in Yanl Snflandrmalarn Gsterimi (C&RT) 91
ekil 4.16. Rektal Tue in Yanl Snflandrmalarn
Gsterimi(C&RT)
92
ekil 4.17. Genetik Yatknlk in Yanl SnflandrmalarnGsterimi
(C&RT)
92
ekil 4.18 YSA iin ROC Erisi 94
ekil 4.19 Yapay Sinir A Modeli 96
ekil 4.20 Ya in Yanl Snflandrmalarn Gsterimi (YSA) 97
ekil 4.21 PSA in Yanl Snflandrmalarn Gsterimi (YSA) 97
ekil 4.22 Rektal Tue in Yanl Snflandrmalarn Gsterimi(YSA)
98
ekil 4.22 Genetik Yatknlk in Yanl SnflandrmalarnGsterimi
(YSA)
98
-
xi
KISATMALAR ve SMGELER
C&RT Snflandrma ve Regresyon Aac
YSA Yapay Sinir Alar
LRA Lojistik Regresyon Analizi
ROC Receiver Operating Characteristic Curve (Alc
lemKarakteristikleri Erisi)
AUC ROC erisi altnda kalan alan (Area under the ROCCurve)
VM Veri Madencilii
CHAID (Chi-Squared Automatic Interaction Detector:
OtomatikKi-Kare Etkileim Belirleme),
MARS (Multivariate Adaptive Regression Splines: okDeikenli
Uyumlu Regresyon Uzanmlan),
QUEST (Quick, Unbiased, Efficient Statistical Tree: Hzl,
Yansz,Etkin statistiksel Aa),
SLIQ (Supervised Learning in Quest),
SPRINT (Scalable Parallelizable Induction of Decision Trees)
ID3 Iterative Dichotomiser 3
-
11. GR ve AMA
Gnmzde teknolojinin hzl geliimi ile tm sektrlerden elde edilen
veri
miktar devasa boyutlara ulam ve verilerin toplanmas, saklanmas,
ilenmesi gibi
problemler ortaya kmtr. yle ki bugn dnyadaki bilgi miktarnn her
yirmi ayda
bir ikiye katland kabul edilmektedir. Bu problemlere, gelien
bilgisayar teknolojileri,
kapasitesi ve ilem gc artan donanmlar ve yazlmlar ile birlikte
zm sunmaya
almtr. Bu zmlerinde en nemlisi veri tabanlar alanndaki
ilerlemelerdir. Ancak
veritaban sistemlerinin artan kullanm ve hacimlerindeki olaanst
art, iletmeleri
toplanan verilerden nasl faydalanlabilecei problemi ile kar
karya brakmtr. Veri
miktar arttka bu verilerin insanlarca anlalmas zorlam; veriler
ierisinde sakl
kalm yararl bilginin elde edilmesi ve Karar Destek Sistemi
erevesinde kullanm,
herhangi bir ara kullanmakszn olanaksz hale gelmitir. Geleneksel
sorgu veya
raporlama aralarnn veri ynlar karsnda yetersiz kalmas, veri
madencilii ve veri
madencilii altnda yaplan snflandrmalar gibi yeni araylara neden
olmaktadr [1, 2,
3].
Snflandrma uygulamalarnda kullanlan pek ok model ve bu modellere
ait
farkl algoritmalar vardr. Bu algoritmalardan hangisinin daha
efektif sonular rettii,
hangi algoritmann hangi alanda daha baarl olduu sorusuna verilen
cevaplar
uygulamalarn baarmn arttracak ve yaplan iin verimini
arttracaktr. Bu sebeple
algoritmalarn karlatrlarak deerlendirilmesi byk nem arz
etmektedir. ok
sayda algoritma olmas, her algoritmann kendi iinde farkl
parametrelerle almas,
her algoritmann birden ok versiyonunun bulunmas, farkl
algoritmalarn farkl amaca
ynelik olmas, kullanlan veri kaynann farkl olmas, algoritmalarn
farkl veri
-
2tiplerini desteklemesi ve veri zerinde yaplan nilemlerin
uygulaycya bal olmas
gibi sebeplerle farkl sonular elde edilmitir [1, 2, 4, 12, 13,
15].
Baml deikenlerin kategorik yapda olduu veri setlerinin
analizinde
bamsz deikenlerin baml deiken zerindeki etkilerini deerlendirmek
ve
birimlerin baml deikenin kategorilerine gre en az hata ile
snflandrlmas iin
kullanlan Snflandrma ve Regresyon Aalar (C&RT); Yapay Sinir
Alar (YSA) ve
Lojistik Regresyon Analizi (LRA) yntemlerinin karlatrlmas yaplm
ve
birbirlerine gre avantaj ve dezavantajlar incelenmitir.
Yntemlerin karlatrlmas
iin gerek bir veri seti ve karlatrma iin ak kaynak koda sahip
bir istatistik
program olan Weka (Waikato Environment for Knowledge Analysis
Ver.3,6,5)
program kullanlmtr.
Snflandrma ve Regresyon Aalar (C&RT); ikili karar aac
oluturan bir
yntemdir. Aataki her bir noda, her bir bamsz deiken iin geliim
skoruna dayal
olarak en iyi kesim noktas ya da en iyi kategori gruplar
oluturulur. Snflandrma ve
Regresyon Aalarnda ama baml deiken ile ilgili verilerin mmkn
olduunca
homojen alt setlerinin meydana getirilmesidir. C&RT,
kategorik yapdaki baml
deikenler iin genellikle Gini indeksi kullanarak en iyi
kestirici deiken seerek aa
yapsn oluturur [3, 4, 14].
Yapay Sinir Alar insan beynindeki sinir alar gibi alarak elle
zm
olana vermeyen son derece karmak yapya sahip problemlerin zmn
salayan
ve deiken yaps konusunda herhangi bir kstlama getirmeksizin
deikenler aras
ilikiyi ortaya koyan ok esnek bir yntemdir. YSA, zellikle
snflandrma problemleri
iin yaygn ekilde kullanlmaktadr. YSA, geriye yaylma algoritmasn
kullanarak a
-
3hatasn minimize ederek birimlerin en az hata ile snflarna
atanmas iin an
arlklarn adm adm hesaplar [5 ,6, 7, 16, 18].
Lojistik Regresyon Analizi ise baml deikenin kategorik ve
bamsz
deikenlerin kark lekli olmas durumunda belirli bir dalm
varsaymna baml
kalmakszn baml deiken ile bamsz deikenler arasndaki
neden-sonu
ilikisinin belirlenmesinde kullanlan bir yntemdir. LR, en ok
olabilirlik tahmin
yntemini kullanarak veri setinden elde edilen olasl maksimum
yapan bilinmeyen
parametre deerleri tahmin eder. Bylece olabilirlik fonksiyonunu
maksimum yapan
parametre tahminleri seilir ve gzlenen veri ile en iyi rten
parametre tahminleri elde
edilir [3, 4, 17].
Literatr taramas yapldnda bu almada seilen snflandrma
ynteminin genellikle ikili varyasyonlar ile karlalmtr. Tarama
sonucunda gncel
almalar tercih edilmi olup bunlardan bazlar aada
zetlenmitir.
Gneri ve ark.[4] baar snflandrmasnda lojistik regresyon ve sinir
alar
yaklam sonucunda elde edilen doru snflandrma oranlarn
karlatrdklarnda
verilerin doru snflandrma olaslklar lojistik regresyon uygulamas
ve sinir alar
yaklam iin %95.17 olarak bulunmutur. ki yntemin ayn sonucu vermi
olmas
sinir alarnn atama problemlerinde kullanlabilirliini
gstermitir.
Kurt ve ark.[5] yapt almada, rencilerin alkol kullanmn
etkileyen
faktrler lojistik regresyon analizi (LR) ve yapay sinir alar
(YSA) ile incelenmitir.
Bu yntemlerin alkol kullanan ve kullanmayan rencileri ayrmadaki
etkinlikleri ROC
erisi yntemiyle karlatrlm. Sonu olarak LR, modelin parametre
tahminleri ve
OR deerleri hakknda bilgi vermesi ve sonularnn kolay
yorumlanabilir olmas
asndan YSAdan daha avantajl olduu grlmtr. Bu nedenle eer
uygulama
-
4sonucunda YSAnn snflandrma performans LRden kt ise LR modeli
tercih
edilmeli; eer YSAnn performans LRden daha iyi ise nemsiz
deikenlerin
modelden karlmasnda LR, YSA iin bir n eleme yntemi olarak
kullanlmaldr
sonucuna varlmtr.
Ocakolunun[6] yapt almada, lojistik regresyon analizi ve yapay
sinir
alarnn snflama etkinliklerini karlatrmay amalamaktadr. Lojistik
regresyon
analizi ve yapay sinir alar yntemleri, bireylerin snflandrma
oranlarna gre
karlatrlmtr. Buna gre YSA modelleri ile snflandrmann LRA
kullanlarak
yaplan snflandrmadan daha iyi sonular verme eiliminde olduu
ayrca yine ar
eitme, mimarinin hatal oluturulmas vb. problemleri olmayan YSA
modellerinin daha
iyi ngr performans salayabildii grlmtr.
Karakn[7] yapt almada, meme kanseri hastalarnn koltuk alt lenf
nod
durumlarn belirleyen SLNB ve AD ameliyatlar olmakszn, her
hastanede kolaylkla
elde edilebilir olan klinik ve patolojik verilerinin girildii
YSA nn, hastalarn koltuk
alt lenf nod durumunu belirlemesi amalanmtr. alma iin Ankara
Numune Eitim
ve Aratrma Hastanesi ve Ankara Onkoloji Eitim ve Aratrma
Hastanesine bavuran
ve meme kanseri 270 kiinin verileri kullanlmtr. ok katmanl ileri
yaylml yapay
sinir a modeli sonular regresyon ve korelasyon katsaylarna
baklarak
deerlendirilmitir. Ayn zamanda tbbi almalarda tp testlerinin
doruluklarn tespit
amal kullanlan ROC analizi ile elde edilen eitim ve test veri
sonularnn belirlilik,
duyarllk ve doruluk sonular deerlendirilmitir. YSAnn sonularnn
kyaslanmas
iin lojistik regresyon yntemi kullanlmtr. Lojistik regresyon ile
hangi verilerin
anlaml olduuna baklm, anlaml olan verilerle yapay sinir a tekrar
eitilmi ve test
-
5edilmitir. Lojistik regresyon ve seilen YSA modelleri
kyaslandnda YSA deerleri
daha baarl olduu grlmtr.
Krann[8] yapt almada, veri madencilii yntemleri ierisinde
snflama
ve regresyon modellerinden en ok kullanlan karar aalar ile
lojistik regresyonun
snflama zellikleri karlatrlarak gerek bir veri seti zerinde
uygulama yaplm ve
sz konusu iki yntemin baarsn gstermek amalanmtr. Sonuta her iki
modelin %
90n zerinde snflandrma baars gsterdii dikkat ekerken, C&RT
ynteminin
daha yksek snflandrma baarsna sahip olduu tespit edilmitir. Bu
noktadan
hareketle C&RT ve lojistik regresyon analizi ile yaplan
almalarda hata riskini en aza
indirmek amacyla C&RT ynteminin kullanlmas daha uygun
bulunmutur.
King ve ark.[39] sembolik renme (C&RT, C4.5, NewID,
ITrule,Cal5, CN2),
istatistik (Naive Bayes, k-en yakn komuluk, kernel younluk,
dorusal ayrma, karesel
ayrma, lojistik regresyon, Bayes Alar) ve yapay sinir alar (geri
yaynm - merkez
tabanl uzaklk fonksiyonu) yntemleri arasnda karlatrma yapmlardr.
Bu
yntemleri be adet resim, iki adet tp, ikier mhendislik ve finans
veri kmeleri
zerinde uygulamlardr. Daha iyi sonular reten algoritmann,
zerinde aratrma
yaplan veri kmesine bal olduu sonucuna ulamlardr ve rnek olarak
iki
kategorili deikenlerde gzlenme orannn %38in zerinde olduu veri
kmelerinde
sembolik renme algoritmalarnn daha verimli sonular rettiini
belirtmilerdir.
Sabzecari ve ark.[10] zel bir bankann kredi derecelendirme amal
veri kmesi
zerinde uyguladklar veri madencilii yntemlerini karlatrmlardr.
Bankalar,
kredi verirken, veri madencilii yntemleri ile kredi bavurusunda
bulunan mterileri
deerlendirerek mteriye kredi verilmesinin uygun olup olmadn
belirlemektedirler.
Sabzecari ve ark. Probit ve lojistik regresyon, C&RT, yapay
sinir alar, bagging ve
-
6MARS algoritmalarn karlatrarak sonularn deerlendirmilerdir.
Olduka kk
bir veri kmesi zerinde yaptklar bu alma sonucunda istatistiksel
modeller
arasndan lojistik regresyon ve makine renme modelleri arasndan
da bagging
modelinin daha baarl sonular rettiini ifade etmilerdir.
Zurada ve ark.[11] salk endstrisinde kt kredilerin
belirlenmesinde
karlatrdklar yapay sinir alar, karar aalar, lojistik regresyon,
hafza-tabanl
sebepleme ve btnletirilmi model arasnda karlatrlma yapmlardr.
Sonuta
yapay sinir alarnn, lojistik regresyon algoritmasnn ve
btnletirilmi modelin daha
iyi kesinlik oranna sahip sonular rettiini, karar aalarnn ise
iyi kredi
snflandrmasn daha yksek bir doruluk derecesiyle tespit ettiini
belirtmilerdir.
-
72. GENEL BLGLER
Veri Madenciliinde kullanlan modeller, temel olarak ekil 2.1de
grld
zere tahmin edici (predictive) ve tanmlayc (descriptive) olmak
zere iki ana balk
altnda incelenmektedir [26].
ekil 2.1. Veri Madencilii Modelleri
Tahmin edici modellerin amac, verilerden hareket ederek bir
model gelitirmek
ve kurulan bu model yardmyla sonular bilinmeyen veri kmelerinin
sonu
deerlerini tahmin etmektir. Eer tahmin edilecek deiken srekli
bir deikense
tahmin problemi regresyon, kategorik bir deikense snflama
problemi olarak
nitelendirilmektedir [2]. Tanmlayc modellerde ise karar vermeye
rehberlik etmede
kullanlabilecek mevcut verilerdeki rntlerin tanmlanmas
salanmaktadr.
Veri Madencilii modelleri fonksiyonlarna gre ise;
Snflama (Classification) ve Regresyon,
Kmeleme (Clustering),
-
8 Birliktelik kurallar (Association Rules) eklinde
snflandrlmaktadr.
ekil 2.1de gsterilen veri madencilii modellerinden snflama ve
regresyon
modelleri tahmin edici, kmeleme, birliktelik kurallar ve ardk
zamanl rntler ise
tanmlayc modellerdir [1].
2.1. SINIFLAMA VE REGRESYON MODELLER
Veri madencilii yntemleri ierisinde en yaygn kullanma sahip
olan, byk
veri kmelerini snflandrarak nemli veri snflarn ortaya koyan veya
gelecek veri
eilimlerini tahmin etmede faydalanlan yntemlerden bir tanesi
snflama ve regresyon
modelleridir.
Veri madenciliinin en nemli alanlarndan biri olan kmeleme,
nesneleri
birbirlerine olan benzerliklerine gre gruplara ayrmaktadr. Yani
kmeleme
modellerinde ama, kme yelerinin birbirlerine ok benzedii ancak
zellikleri
birbirlerinden ok farkl olan kmelerin bulunmas ve veri
tabanndaki kaytlarn bu
farkl kmelere blnmesidir. Bylece nesneler, rneklenen kitle
zelliklerini iyi
yanstan etkili bir temsil gcne sahip olacaktr [1,2,3].
Snflama en ok bilinen veri madencilii yntemlerinden birisidir;
resim, rnt
tanma, hastalk tanlan, dolandrclk tespiti, kalite kontrol
almalar ve pazarlama
konulan snflama yntemlerinin sklkla kullanld alanlardr. Snflama
tahmin edici
bir model olup, havann bir sonraki gn nasl olaca veya bir kutuda
ka tane mavi top
olduunun tahmin edilmesi bir snflama ilemidir [27]. Matematiksel
olarak snflama;
D = {t1,t2,...,tn} bir veri taban ve her bir ti bir kayt
(gzlem),
C = {Cl,C2,...,Cm} ise m adet snftan oluan snflar kmesini temsil
etmek
zere,
-
9 f : D C ve her bir ti bir snfa dahildir. Ayrca her bir Cj ayr
bir snftr ve her
bir snf kendisine ait kaytlar ierir. Yani,
C j = { t i l f { t i ) = C j,\
-
10
belli bir veri zellii seilerek algoritmann bu kt zellii
deerlerine ulamak iin
hangi girdi zelliklerinin bir arada olmas gerektiini aa veri
yaplar eklinde
kefetmesi salanr [28].
Karar aalar, basit karar verme admlar uygulanarak, ok sayda kayt
ieren
bir veri kmesini ok kk kayt gruplarna blmek iin kullanlan bir
yapdr [29].
Her baarl blme ilemiyle, sonu gruplarnn yeleri bir dieriyle ok
daha benzer
hale gelmektedir.
Bu teknikte snflandrma iin bir aa oluturulur, daha sonra veri
tabanndaki
her bir kayt bu aaca uygulanr ve kan sonuca gre de bu kayt
snflandrlr. Karar
aalar veri setinin ok karmak olduu durumlarda bile, baml deikeni
etkileyen
deikenleri ve bu deikenlerin modeldeki nemini basit bir aa yaps
ile grsel
olarak sunabilmektedir [8,28].
Karar aac yntemini kullanarak verinin snflanmas temel olarak iki
admdan
olumaktadr. Birinci adm; nceden bilinen bir eitim verisinin
model oluturmak
amac ile snflama algoritmas tarafndan zmlendii renme
basamadr.
renilen model, snflama kurallar veya karar aac olarak gsterilir.
kinci adm ise
eitim verisinin snflama kurallarnn veya karar aacnn doruluunu
belirlemek
amacyla test edilerek kullanld snflamadr. Eer doruluk kabul
edilebilir oranda
ise, kurallar yeni verilerin snflanmas amacyla kullanlr [8].
Karar aac algoritmalarn bir probleme uygulayabilmek iin
aadaki
koullarn salanmas gerekir:
Olaylarn zelliklerle ifade edilebilmesi gerekir. Nesnelerin
belli sayda zellik
deerleriyle ifade edilebilmesi gerekir. rnein; souk, scak vb.
zelliklerin
srekli ve ya kesikli olmas fark etmez.
-
11
Snflar belirleyebilmek iin gereken ayrc zelliklerin olmas
gerekir. Karar
aac, adnda belirtildii ekilde aa grnmnde bir tekniktir.
Karar
dmleri, dallar ve yapraklardan oluur [19].
Karar aalarnn kk, dallar ve yapraklardan oluan aaca benzeyen bir
yaps
olup, rnekteki tm gzlemleri kapsayan bir kk ile balayp aaya doru
inildike
veriyi alt gruplara ayran dallara ayrlrlar. Bu kkten dallara
doru byyen aa
yapsnda her boum dm dr, oluan aalarda homojen olmayan dmlere
yavru dm (child node), homojen dmlere ise terminal dm (parent
node)
ad verilir [30]. Dmler zerinde niteliklerin test ilemi yaplmakta
ve test ileminin
sonucu aacn veri kaybetmeden dallara ayrlmasna neden olmaktadr.
Her dmde
test ve dallara ayrlma ilemleri ardk olarak gereklemekte ve sonu
olarak aa
snflar ile son bulmaktadr.
Dm: Veriye uygulanacak test tanmlanr. Her dm bir zellikteki
testi
gsterir. Test sonucunda aacn dallar oluur. Dallar olutururken
veri kayb
yaanmamas iin verilerin tmn kapsayacak sayda farkl dal
oluturulmaldr.
Dal: Testin sonucunu gsterir. Elde edilen her dal ile
tanmlanacak snfn
belirlenmesi amalanr. Ancak daln sonucunda snflandrma
tamamlanamyorsa tekrar
bir karar dm oluur. Karar dmnden elde edilen dallarn
sonucunda
snflandrmann tamamlanp tamamlanmad tekrar kontrol edilerek devam
edilir.
Yaprak: Daln sonucunda bir snflandrma elde edilebiliyorsa yaprak
elde
edilmi olur. Yaprak, verileri kullanarak elde edilmek istenen
snflandrmann
snflarndan birini tanmlar [30].
Karar aacnda, tanmlanm olan soruya ilikin cevap gruplara
ayrlmaktadr.
Cevaplar soruya verilecek bir lt belirlendikten sonra setler
arasndaki riski
-
12
maksimize edecek ekilde blnmekte ve en iyi blnmeyi bulmak iin
her soruda ayn
ilem tekrar edilmektedir. Bir soru iin grup oluturulduktan ve
gruplar arasndaki risk
maksimize edildikten sonra oluan iki grup iin bu ilemler devam
ettirilmektedir. Bu
ilemlere istatistiksel olarak anlaml bir fark bulunana kadar
devam edilmekte,
istatistiksel olarak anlaml bir fark bulunmadnda ise son
verilmektedir. Ayrtrma
ilemi tamamlandktan sonra ise o grup ierisinde yer alan
gzlemlerin oranna gre
grup deerlendirilmektedir [31].
Karar aalarnn oluturulmas aa oluturma ve aa budama
basamaklarndan oluur.
Aa oluturma: Veri kaynandaki btn nesneleri ieren kk dmden
balar, yinelemeli olarak her dmde var olan nesneleri seilecek
olan bir nitelie gre
farkl dallara ayrarak btn nesneleri snflandracak ekilde yaprak
dmlere blene
kadar, ya da ayrm yapc bir nitelik kalmayana kadar devam eder.
Snama
dmlerinde eldeki nesnelerin hangi nitelie gre alt dmlere blndnde
en ok
verimin alnacan bulmak ve dallanmay bu nitelie gre yapmak
algoritmann gcn
arttrr. Nesneler alt dmlere blndnde alt dmlerdeki nesnelerin
trdelii ne
kadar yksek olursa o dmdeki dallanma o kadar verimli olur. Bu
sebeple, her
dmde, snamas yaplacak olan nitelik (o dmdeki nesneleri alt
dmlere
bldnde) homojenite bakmndan en yksek kazanc salayacak nitelik
olarak seilir
[8,31].
Aa Budama: Aa oluturma basama, verileri tamamen ayn snf
yelerinden oluan yapraklara blnceye ya da karlatracak nitelik
kalmayncaya
kadar blmeler. Bu algoritmann sonucu olarak, ok derin ya da ok
az deneme kmesi
rnei ieren yaprak dmlere sahip aalar oluabilir. Byle bir aac
renme
-
13
kmesi zerinde test edince elbette ki doruluu ok yksek sonular
verir. Ancak
byle bir model henz grlmemi rneklerle karlarsa ok kt doruluklu
sonular
retebilir. Byle bir model verimli deildir ve veriyi
genellemekten uzaktr. Byle bir
modelin sahip olduu bu zellie ar uyum (overfitting) denir. Ar
uyum bir
modelde istenmeyen bir sonutur [27,31].
An uyum genelde verideki grltden (hatal snf deeri, yanl
deerli
deikenler) kaynakland gibi problem alannn karmaklndan ya da
rastgelelikten
kaynaklanabilir.
Ar uyumu azaltmak iin aalarda budama ilemi uygulanr. Budama
ilemi,
baz dallarn ya da alt dallarn kaldrlarak o dala ait nesnelerin
youn olduu snfla
etiketlenmi yaprak dmlerle yerletirilmesiyle gerekletirilir. Aa
oluturulurken
erken-dur yntemiyle erken-budama yaplabilecei gibi aa
oluturulduktan sonra
budama ge-budama yaplabilir. Ge-budama ynteminin daha baarl
olduu
bilinmektedir. Zira erken-budama yntemi hatal sonulara yol
aabilir, nk henz
dallanma yaplmam bir dal budandnda, aacn o noktadan sonra ne
ekil alm
olaca o aamada bilinmemektedir. Ancak ge-budama yaplrken aa
zaten olumu
bulunmaktadr ve hangi dallarn aslnda gereksiz olduu, an uyum
yaratt
bilinmektedir. Ge-budama yaplrken dmlerdeki beklenen hata
deerine baklr.
Eer bir dmdeki beklenen hata miktar, o dme ait alt dallardaki
beklenen hata
miktarndan kk olursa alt dallar budanr [31,32].
D = {t1,...,tn} bir veri taban olmak zere, t t , t i={t1...tin}
den ve bu veri taban
{A 1 ,A 2 , . . . ,A n } alanlarndan olumaktadr.
Bunun dnda C = {C1,...,C} kadar da snf verilmi olduunda,
Her bir dm At alanyla tanmlanm,
-
14
Her dmden ayrlan kollar bu alanla ilgili bir soruya yant
veren,
Her yapran bir snf olduu karar aac ekil 2.2da gsterilmitir
[27].
ekil 2.2. Karar Aac Yaps
ekil 2.2de grlen karar aacndaki A1, A2 ,..., An den her biri bir
dm
oluturmakta ve her dm kendinden sonra iki dala ayrlmaktadr. Bu
ayrlma ilemi
srecinde, Ai dm hakknda cevab veri tabannda bulunacak bir soru
sorulmakta ve
verilen yanta gre de bir dal izlenmektedir. Aataki C1 ,C2
,...,Cn lerin her biri birer
yapra ayn zamanda snf temsil etmektedirler.
Karar aalar oluturulurken kullanlan algoritmann ne olduu nemli
bir
husustur. Kullanlan algoritmaya gre aacn ekli deiebilir. Bu
durumda deiik aa
yaplar da farkl snflandrma sonular verecektir. Kk denilen ilk dm
oluturan
Ai nin farkl olmas, en utaki yapraa ularken izlenecek yolu ve
dolaysyla
snflandrmay da deitirecektir [27].
-
15
Deikenlerin seiminde yinelemeli olan algoritmann dngden kmas iin
o
dmdeki tm elerin ayn snfa dhil olmas art vardr. Eer kalan
deerler sadece
bir snfa aitse veya snflandrlabilecek deer kalmadysa dngsel
algoritma sonlanr
ve karar aac oluturulmu olur. Sonuta oluan snflardaki her bir
eleman ayn snfn
dier elemanlar ile benzer zellikler gsterir. Aa yaps heterojen
yapdaki veri
kmesinin daha kk ve homojen bir yapya dnmesi iin kurallar
tanmlar. Aa
inas sonunda elde edilen aa maksimum aa olarak adlandrlr ve
renme
kmesindeki deney nitelerine en uygun aatr. Ancak maksimum aa
pratikte iki
dezavantaja sahiptir [32].
Maksimum aa balang veri setini (renme kmesini) kusursuz
biimde
tanmlar nk eklenen her bamsz deiken hatal snflama orann drr.
Bu durumda, maksimum aa veri iin olmas gerekenden daha iyi bir
tahmin
modeli sunar. Ancak, balang veri setine ar uyumlu maksimum
aalar
farkl bir veri seti sz konusu olduunda iyi bir tahmin
salayamazlar.
Bir snflama aacnn karmaklk ls o aacn terminal dm saysna
eittir. Terminal dm saylar ve dolaysyla karmakl yksek olan
maksimum aacn anlalmas ve yorumlanmas gtr.
Maksimum aacn pratikte ortaya kard bu sorunlarn zm iin
maksimum aacn budanmas gereklidir. Maksimum aacn budanmas daha
kk
aalar dizisi oluturur ve oluturulan bu dizi ierisinden optimum
aa seilir.
Optimum aa maksimum aatan daha az karmakla sahiptir ancak
renme
kmesine maksimum aatan daha az uyumludur ve hatal snflama oran
da daha
yksektir [27,31,32].
-
16
Karar aacnn kurulmas iin kullanlacak girdi olarak bir dizi kayt
verilirse bu
kaytlardan her biri ayn yapda olan birtakm zellik/deer
iftlerinden oluur. Bu
zelliklerden biri kaydn hedefini belirtir. Ama, hedef-olmayan
zellikler kullanlarak
edef zellik deerini doru kestiren bir karar aac belirlemektir.
Hedef zellik
ounlukla sadece {evet, hayr}, veya {baarl, baarsz} gibi ikili
deerler alr [19].
Bir karar aac ne bildiimizi (rn., renme verisi) zetledii iin
deil, yeni
durumlarn snflamasn doru yapt iin nemlidir.
Karar aac tekniini kullanarak verinin snflanmas aamadan
oluur.
renme: nceden sonular bilinen verilerden (eitim verisi)
model
oluturulur.
Snflama: Yeni bir test verisi kmesi modele uygulanr, bu ekilde
karar
aacnn doruluu belirlenir. Test verisine uygulanan bir modelin
doruluu,
yapt doru snflamann test verisindeki tm snflara orandr. Her
test
rneinde bilinen snf, model tarafndan tahmin edilen snf ile
karlatrlr.
Uygulama: Eer doruluk kabul edilebilir oranda ise, karar aac
yeni verilerin
snflanmas amacyla kullanlr [33].
Test verisini en iyi ekilde dallara ayran zellik tespit
edilerek, bu zellik karar
aacnn oluturulmasnda daha nce seilir. Bylece daha iyi bir karar
aac
oluturulur. En iyi dallara ayran zelliin tespitinde eitli ltler
gelitirilmitir.
Bu ltlerin baz rnekleri unlardr:
p(i | t), i snfna ait verilerin, verilen bir t dmndeki blnmesini
gstersin.
c snf saysdr ve entropi hesaplamasnda 0 log2 0 = 0 eklinde
dnlmtr.
c-1
Entropi(t) = p(i | t) log2p(i | t), (2.1)
-
17
i=0
Entropi bir dmn ne kadar bilgi verici olduunu lmede kullanlr. Bu
yi
ile ne kastedildiini belirtir. Bu kavram Claude Shannon
tarafndan ilk kez Bilgi Teorisi
iinde tanmlanmtr.
c-1
Gini(t) = 1 [p(i | t)]2, (2.2)
i=0
Snflandrma hatas(t) = 1 maxi[p(i | t)],
Karar aac oluturulduktan sonra, kkten yapraa doru inilerek
kurallar
belirlenir. Ancak ok sayda dal ve dmden oluan karar aalarnda
kurallarn
belirlenmesi zorlar. Karar aac modelini daha okunabilir hale
getirmek iin kurallarn
yazmnda IF-THEN (Eer-ise-O Zaman) biiminde artl ifadeler
kullanlr. IF (Eer-
ise) ksm daln sonuna giden yol zerindeki tm testleri ierirken
THEN (O Zaman)
ksm son snflamay gsterir. IF THEN yapsndaki kurallara Karar
Kurallar (Decision
Rules) denir [18,22].
Karar aalar, model kurulumu ve sonularnn yorumlanmasnn kolay
olmas,
veritaban sistemleri ile kolayca entegre edilebilmeleri ve
gvenilirliklerinin iyi olmas
nedenleri ile snflama modelleri ierisinde en yaygn kullanma
sahip tekniktir [34].
Karar aalarnn gl ynleri aadaki gibi zetlenebilir:
Karar aalar anlalabilir kurallar retirler.
Karar aalar ar hesaplamaya gerek kalmadan snflandrma
yaparlar.
Karar aalar hem srekli ve hem de kesikli deikenler iin
uygundur.
Karar aalar snflandrma ve kestirim iin hangi alanlarn en
nemli
olduunu ak biimde gsterir [35].
-
18
Karar aalarna dayal olarak gelitirilen birok algoritma vardr.
Bu
algoritmalar kk, dm ve dallanma kriteri seimlerinde izledikleri
yol asndan
birbirlerinden ayrlrlar. Karar aac oluturmak iin gelitirilen bu
algoritmalar
arasnda;
CHAID (Chi-Squared Automatic Interaction Detector: Otomatik
Ki-Kare
Etkileim Belirleme),
C&RT (Classification and Regression Trees: Snflama ve
Regresyon Aalar),
MARS (Multivariate Adaptive Regression Splines: ok Deikenli
Uyumlu
Regresyon Uzanmlar),
QUEST (Quick, Unbiased, Efficient Statistical Tree: Hzl, Yansz,
Etkin
statistiksel Aa),
SLIQ (Supervised Learning in Quest),
SPRINT (Scalable Parallelizable Induction of Decision Trees)
ID3, C4.5 ve C5.0 yer almaktadr.
2.1.2. Yapay Sinir Alar
nsanlarn beynin almasn saysal bilgisayarlar zerinde taklit etmek
istemesi
sonucunda yapay sinir alar ortaya kmtr. Temelde beynin alma
yaps, insanlar
gibi dnen ve renen sistemler elde etme fikrinin olmas, almalar
insan beynini
oluturan hcrelerin incelenmesi zerine younlatrmtr. Bu almalar
esnasnda her
bir nronun dier nronlar ile ilikili olduu ve ald baz girdileri
ktya
dntrd gzlemlenmitir. Gnmzde yapay sinir alan olarak adlandrlan
bu
alan, birok nronun belirli kurallar erevesinde bir araya gelerek
bir ilevin
-
19
gerekletirmesi esnasndaki yapsal, matematiksel ve felsefi
sorunlara cevap bulmaya
alan bir bilim dal olmutur [45].
YSA kavram beynin alma ilkelerinin saysal bilgisayarlar zerinde
taklit
edilmesi fikri olarak ortaya km ve ilk almalar beyni oluturan
biyolojik
hcrelerin, ya da literatrdeki ismi ile nronlarn matematiksel
olarak modellenmesi
zerinde younlamtr [46].
Yapay sinir a, beynin belirli bir ii veya fonksiyonu yerine
getirme yntemini
modelleyen bir makinedir. An yaps, elektronik sistemler veya
bilgisayar yazlmlar
ile tanmlanmaktadr. Tanmlanan bu model, sinir hcresi veya ilem
birimi ad verilen
hcreler arasndaki balanty kullanmakta ve bu ilemler esnasnda
renme ad verilen
bir sre ile performansn artrabilmektedir. Bu noktada yapay sinir
a kavramn
deneysel bilgi saklama ve kullanma hazr hale getirme yeteneine
sahip basit ileme
birimlerinden oluan, ok youn, paralel ve datlm dzende alan bir
ilemci
olarak tanmlamak mmkndr. nsan beyni ile benzerlii ise bilgiyi
renme yoluyla
elde etmesi ve bilginin depolanmas iin sinir hcreleri aras ba
kullanmasdr [47].
2.1.2.1. Yapay Sinir A Nedir?
Bir yapay sinir a, biyolojik sinir alarnn karakteristiklerine
benzer
karakteristiklere sahip bir bilgi ileme sistemidir. YSA, insann
idrak etmesi ve
biyolojik nron yapsnn matematiksel modelinin aadaki kurallar
varsaylarak
genelletirilmesi sonucunda oluturulmutur [48]:
Bilgi ileme, nron ad verilen birok basit elemanlarda
gerekleir;
Sinyaller, nronlar arasndaki ilikiyi salayan balantlarla
iletilir;
-
20
Her bir balantnn bir arlk deeri vardr ve bu deer, gerek
nronlarda
olduu gibi sinyal geiini retmektedir;
Sinir a iindeki her bir nrona ayn bir aktivasyon fonksiyonu
uygulanr
(genelde bu dorusal olmayan bir fonksiyondur) ve bu fonksiyonun
k deeri
sayesinde nronun k sinyali hesaplanr;
Herhangi bir yapay sinir a;
Nronlar arasndaki bantnn bir modeli yani mimarisi ile,
Balantlardaki arlklarn hesaplanmas (bu hesaplama, eitim kural ya
da
renme algoritmas olarak da adlandrlr) ile,
Aktivasyon fonksiyonu ile tanmlanabilir.
Yapay sinir alarnn karakteristik zellikleri uygulanan a modeline
gre
deimektedir. Ancak tm modeller iin genel zellikler unlardr:
[49]
Yapay sinir alar makine renmesi gerekletirirler.
Programlar alma stili bilinen programlama yntemlerine
benzememektedirler.
Bilgiyi saklarlar.
rnekleri kullanarak renirler.
Gvenle altrlabilmeleri iin nce eitilmeleri ve performanslarnn
test
edilmesi gerekmektedir.
Grlmemi rnekler hakknda bilgi retirler. Bunu genelleme zellii
sayesinde
yaparlar.
Alglamaya ynelik olaylarda kullanlabilirler.
ekil ilikilendirme ve snflandrma yapabilirler.
-
21
rnt tamamlama gerekletirebilirler.
Kendi kendine organize etme ve renebilme yetenekleri vardr.
Eksik bilgi ile alabilmektedirler.
Hataya ve grltye kar duyarlla ve toleransa sahiptirler.
Belirsiz, tam olmayan bilgileri ileyebilmektedirler.
Dereceli bozulma (Graceful degradation) gsterirler.
Datk bellee sahiptirler. Veri datlm birleik hafza yaps kullanlr
ve
bilgi farkl formlara dntrlerek ilenebilir.
Sadece nmerik bilgiler ile alabilmektedirler [49,50].
Bir yapay sinir a, nron, birim, hcre ya da dm olarak adlandrlan
ok
saydaki basit ilem birimlerinden oluur. Her bir nron, dier bir
nrona belli bir
arlk deerine sahip olan haberleme balantlaryla balanr. Arlklar,
yapay sinir
ann bir problemi zmesi iin gerekli olan bilgiyi hazrlamaktadr.
YSA ok eitli
problemlerin zmnde kullanlabilirler. rnek olarak, bilgileri ve
numuneleri
saklamada ve onlar daha sonra tekrar tanmada, numuneleri
snflandrmada, giri
numunelerinin k numunelerine dntrlmesinde, benzer rneklerin
gruplandrlmasnda ya da doal olmayan optimizasyon problemlerinin
zmlerinin
bulunmasnda ve daha pek ok alanda YSA ok geni bir biimde
kullanlabilir [50].
rnek olarak ekil 2.3de gsterilen bir Y nronunu dnelim. Bu nron
X1,X2
ve X3 nronlarndan giri sinyallerini alr. Bu nronlarn
aktivasyonlar yani k
sinyalleri, srasyla x1,x2 ve x3 tr. Balantlar zerindeki arlklar
X1,X2 ve X3
nronlarndan Y nronuna doru srasyla w1,w2 ve w3 tr. A girii olan
y _ in deeri
-
22
X1,X2 ve X3 den Yye giden arlkl sinyallerin toplamdr. y _ in
deeri aadaki
eitlikteki gibi hesaplanr [50].
y _ in=w1x1+ w2x2+ w3x3 (2.3)
ekil 2.3. Basit Bir Yapay Nron
Y nronunun aktivasyonu y, aa giri deerlerinin bir fonksiyonu
olarak
tanmlanr.
y=f(y _ in)
Bu fonksiyon, S-biimli sigmoid fonksiyon olabilir. Sigmoid
fonksiyonun formu
aada verildii gibidir.
1( )1 exp( )
f xx
= + - (2.4)
Bu fonksiyonu, dier aktivasyon fonksiyonlarndan biri de
olabilir.
-
23
Y nronunun Z1 ve Z2 nronlarna v1 ve v2 arlklaryla baland
varsaylsn. Bu durum, ekil 2.4de gsterilmektedir. Y nronu y
sinyalini dier
birimlere gnderir. Bununla birlikte, genel olarak Z1 ve Z2
nronlar tarafndan alnan
sinyaller farkl olmaktadr; nk her bir sinyal aktarld balantda
bulunan v1 ve v2
arlklar ile orantldr. Z1 ve Z2 nin aktivasyonlar olan z1 ve z2
deerleri, sadece tek
bir nrona bal deildir. Onlar birbirinden farkl birden fazla
nrondan gelen sinyallere
baldr.
ekil 2.4 deki yapay sinir a basit olmasna ramen, gizli birimin
grnm ve
dorusal olmayan aktivasyon fonksiyonu sayesinde birok problemi
zebilir. Baka bir
ynden gizli bir birime sahip yapay sinir ann retilmesi yani
arlklarn optimal
deerlerinin bulunmas olduka zordur [6].
ekil 2.4. Basit Bir Yapay Sinir A [6]
-
24
2.1.2.2. Biyolojik Sinir Alar
ekil 2.5. Biyolojik Sinir Sisteminin Blok Gsterimi
Biyolojik sinir sistemi verinin alnmas, yorumlanmas ve karar
retilmesi gibi
ilevlerin yrtld beyni merkezde bulunduran 3 katmanl bir yapdr.
Uyarlar alc
sinirler ile birlikte elektriksel sinyallere dntrlerek beyne
iletilir. Beynin
oluturduu ktlar ise, tepki sinirleri tarafndan belirli tepkilere
dntrlr.
ekil 2.6. Biyolojik Sinir Hcresi [5,47]
Sinir a yapsnda bilgilerin alc ve tepki sinirleri arasnda ileri
ve geri
beslemeli olarak deerlendirilmesi ve sonucunda tepkilerin
olumas, kapal bir evrim
srecine benzemektedir. Temel ilem eleman sinir hcreleridir. nsan
beyninde
-
25
yaklak 10 milyar sinir hcresi olduu tahmin edilmektedir. ekil
2.6 da gsterildii
gibi sinir hcreleri; hcre gvdesi, gvdeye giren alc lifler
(dentrit) ve gvdeden kan
sinyal iletici lifler (akson) olmak zere 3 temel bileenden
meydana gelir.
Dentritler aracl ile bilgiler dier hcrelerden hcre gvdesine
iletilir.
Hcrelerde oluan ktlar ise akson yardm ile bir dier hcreye
aktarlr. Aktarmn
gerekletii bu noktada aksonlarda ince yollara ayrlabilmekte ve
dier hcrenin
dentritlerini oluturmaktadrlar. Akson-dentrit bantsn olutuu bu
noktalara sinaps
ad verilir [5,47].
Sinapsa ulaan ve dentritler tarafndan alnan bilgiler genellikle
elektriksel
darbelerdir, fakat bu bilgiler sinapstaki kimyasal ileticilerden
etkilenirler. Hcrenin
tepki oluturmas iin bu tepkilerin belirli bir srede belirli
seviyeye ulamas
gerekmektedir. Bu deer eik deeri olarak adlandrlr [23,47].
YSAlar, insan beyninin alma prensibi rnek alnarak
gelitirilmeye
allmtr ve aralarnda yapsal olarak baz benzerlikler vardr [52].
Bu benzerlikler
Tablo 2.1de ve istatistiksel terimler yapay sinir alar terimleri
arasndaki terminolojik
ilikiler de Tablo 2.2 de verilmitir [50].
Tablo 2.1. Biyolojik Sinir Hcresi
Sinir Sistemi Yapay Sinir A
Nron lemci Eleman
Dentrit Girdiler
Hcre Gvdesi Transfer Fonksiyonu
Akson Yapay Nron k
Sinaps Arlklar
-
26
Tablo 2.2. statistiksel Yntemler le Yapay Sinir Alarnn
Benzeimi
statistik Yapay Sinir A
Model A
Tahmin renme
Regresyon Danmal renme
nterpolasyon Genelletirme
Gzlem renme Algoritmas
Parametre A Parametreleri
Bamsz Deiken Giri Verileri
Baml Deiken k Verileri
Snr Regresyonu Arlk Budama lemi
2.1.2.3. Yapay Sinir Alarnda Genel Yap
ekil 2.7. Yapay Sinir Alarnn Genel Yaps
-
27
Girdi Katman: Girdi katman en az bir girdi elemannn bulunduu
blmdr.
Girdi katmannda veriler herhangi bir ileme tabi tutulmadan
girdileri ile ayn deerde
kt retirler.
kt Katman: kt katman en az bir ktdan oluur ve kt a yapsnda
bulunan fonksiyona baldr. Bu birimlerde girdi katmannda olann
aksine ilem
gerekletirilir ve birimler kendi ktlarn retirler.
lem Katman: Genellikle "Kara Kutu" olarak adlandrlr. Girdi
birimlerinin
belirli ilemlere tabi tutulduu blgedir. Seilen a yapsna gre ilem
katmannn
yaps ve fonksiyonu da deiebilir. Tek bir katmandan oluabilecei
gibi birden fazla
katmandan da oluabilir [47].
2.1.2.4. Yapay Sinir Hcresi
Biyolojik sinir alarnn yap bileenleri sinir hcreleridir benzer
ekilde yapay
sinir alarnn da yapay sinir hcreleri bulunmaktadr (ekil 2.8).
YSA, insan sinir
andaki gibi nronlardan ve onlar arasndaki balantlardan oluur.
Bilgi, a tarafndan
bir renme sreciyle evreden elde edilir. Elde edilen bilgileri
biriktirmek iin sinaptik
arlklar olarak da bilinen hcreler aras balant gleri kullanlr
[53].
-
28
ekil 2.8 Basit Alglayc Modeli [53]
YSAya bilgi saysal olarak d dnyadan, dier hcrelerden ya da
kendi
kendisinden gelebilir. Sinir hcresine bilgiler arlklar yoluyla
tanrlar. Arlk
deerleri bilginin nemini ifade eder, deiken ya da sabit deerler
olabilirler, pozitif ya
da negatif deerler alabilirler. Bir sinir hcresine gelen net
bilgi yaygn olarak toplama
fonksiyonu araclyla hesaplanr. Her girdi deeri kendi arl ile
arplr. Toplama
fonksiyonu tm girdiler iin gelen bu deerleri toplayarak net hcre
ktsn hesaplar.
Her hcre dier hcrelerden bamsz olarak bu net deerini hesaplar.
Sapma (bias-bk)
deerinin aktivasyon fonksiyonuna giren deeri ykseltme ya da drme
etkisi vardr.
Aadaki eitlikte kullanlan xj; gelen bilgileri, wkj her girdi
deerine ait arlklar, bk
sapma deerini, vk nronun kt deerini ifade etmektedir [7].
1
m
k kj j kjV w x b
== S + (2.5)
Aadaki eitlikte grld gibi her sinir hcresinin net bilgisi eik
deerine
sahip bir aktivasyon fonksiyondan geirilerek gerek bir kt
oluturulur. Genellikle
kullanlan aktivasyon fonksiyonlar eik, sigmoid, hiperbolik
tanjant vb.
-
29
fonksiyonlardr. Aktivasyon fonksiyonu ((.)) genellikle dorusal
olmayan bir
fonksiyondur.
( )k ky vj= (2.6)
YSA herhangi bir konu ile ilgili veri setleriyle eitilirken
eitim algoritmalar
kullanrlar. renilmesi istenen olay iin oluturulan eitim seti aa
sunulurken hedef
kt deerleri de aa sunulabilir. Sadece girdi seti aa sunulabilir,
sistemin kendi
kendine renmesi istenilebilir ya da her girdi seti iin sistemin
kendisinin bir kt
retmesi salanabilir. retilen ktnn doru ya da yanl olduunu
gsteren sinyal
retilerek, bu sinyale gre sistem eitime devam edilebilir
[54].
2.1.2.5. Yapay Sinir Ann Temel Elemanlar
Yapay sinir alar aadaki varsaymlar zerine kurulmutur: [55]
Bilgi ileme nron olarak isimlendiren basit elemanlarda
gerekletirilir
aretler nronlar arasndaki balantlardan geer
Her balant birok iareti tayan bir arla sahiptir
Her nron kendi giri deerine k iaretini belirlemek iin
aktivasyon
fonksiyonu uygular.
Yapay sinir alar, birbirine bal ok sayda ilemci elemanlardan
olumu,
genellikle paralel ileyen yaplar olarak adlandrlabilir. Yapay
sinir alarndaki ilem
elemanlar (dmler) basit sinirler olarak adlandrlrlar. Bir yapay
sinir a birbirine
balantl, ok sayda dmlerden oluur.
Yapay sinir alar insan beyni gibi renme, hatrlama ve genelleme
yeteneine
sahiptirler.
-
30
nsan beyninde renme 3 ekilde olur;
Yeni aksonlar reterek,
Aksonlarn uyarlmasyla,
Mevcut aksonlarn glerini deitirerek.
Her aksonun zerinden geen iaretleri deerlendirebilecek yetenekte
olduu
savunulmaktadr. Aksonun bu zellii, bir iaretin belli bir sinir
iin ne kadar nemli
olduunu gstermektedir [48].
2.1.2.5.1. Giriler
Giriler tarafndan bir yapay sinir hcresine bir baka yapay sinir
hcresinden
veya d dnyadan bilgi al yaplr. Bunlar an renmesi istenen rnekler
tarafndan
belirlenir.
2.1.2.5.2. Arlklar
Arlklar bir yapay sinir hcresinin girileri tarafndan alnan
bilgilerin nemini
ve hcre zerinde etkisi gsteren uygun katsaylardr. Her bir giri
iin bir arlk vardr.
Bu arln byk olmas bu giriin nemli olduu ya da arln kk olmas
giriin
nemsiz olduunu gstermez. Bir arln deerinin sfr olmas o a iin en
nemli
olay olabilir. Eksi deerler de yine giriin nemsiz olduunu
gstermez. Arln art
ve eksi olmas giriin etkisinin pozitif ya da negatif olduunu
gsterir. Arlklar
deiken ya da sabit olabilirler [56].
-
31
2.1.2.5.3. Toplama levi
Toplama ilevi bir yapay sinirdeki her bir giri ile o girie ait
olan arln
arplarak bu arpmlarn toplanmasdr.
n
i iiNet Toplam x w= S
(2.7)
Ancak birok uygulama aadaki gibi eik deeri olan da bu
toplamaya
katlmtr.
n
i ii
NetToplam x w q= + ya dan
i ii
NetToplam x w q= - (2.8) eik deerinin girilerden bamsz olduu iin
btn girilerin sfr olmas
durumunda k deerinin sfr deil de eik deerine eit olduu grlr ki
bu da,
belirtilen artlar altnda nron knn sfr olmas zorunluluunu ortadan
kaldrr. Eik
deerinin kullanm, toplama fonksiyonuna +1 ya da -1 deerine sahip
sabit bir giriin
arlna sahip bir balant ile eklendii eklinde yorumlanr [48].
Ayrca her model ve her uygulama iin bu toplama fonksiyonun
kullanlmas
art deildir. Baz modeller, kullanlacak toplama fonksiyonunu
kendileri belirler. ou
zaman daha karmak olan deiik toplama fonksiyonlar kullanlr.
Bunlar Tablo 2.3de
gsterilmitir. Baz durumlarda girilerin deeri nemli olurken,
bazlarnda says
nemli olabilir. Bir problem iin en uygun toplama fonksiyonunu
belirlemek iin bir
forml gelitirilememitir. Bu yzden en uygun toplama fonksiyonunun
bulunmas
deneme yanlma yoluyla belirlenir. Ayrca ayn problem iin
kullanlan yapay sinir
hcrelerinden hepsi ayn toplama fonksiyonunu kullanabilecei gibi
her biri iin farkl
toplama fonksiyonu kullanlabilir [48].
-
32
Tablo 2.3 Toplama Fonksiyonu rnekleri Toplama levi
Toplama levi Aklama
arpm
i iiNet Girdi x w= P
Giriler ve arlklar arplr sonra bu
deerler de birbiriyle arplr.
Maksimum (En ok)
( ), 1,2,...,i iNet Girdi Max x w i N= =
N adet giri ve arlk birbiriyle
arpldktan sonra en by net girdi
olarak kabul edilir.
Maksimum (En az)
( ), 1, 2,...,i iNet Girdi Min x w i N= =
N adet giri ve arlk birbiriyle
arpldktan sonra en k net girdi
olarak kabul edilir.
ounluk
sgn( )i iiNet Girdi x w= S
N adet giri ve arlk birbiriyle
arpldktan sonra pozitif ve negatif
olanlarn says bulunur. Bunlardan
byk olan net girdi olarak alnr.
Kmltif Toplam
( ) ( )i iiNet Girdi Net eski x w= + S
Hcreye gelen bilgiler arlkl olarak
toplanr ve daha nce gelen bilgilere
eklenerek hcrenin net girdisi bulunur.
2.1.2.5.4. Etkinlik levi (Aktivasyon Fonksiyonu)
Yapay nronun davrann belirleyen nemli bir etken aktivasyon
fonksiyonudur. Buna ayn zamanda renme erileri de denir.
Aktivasyon fonksiyonu
hcreye gelen net girdiyi, dier bir deyile toplama fonksiyonunu
ileyerek bu hcreye
gelen girilere karlk olan k belirler.
Aktivasyon fonksiyonu da yapay sinir alarnn farkl modelleri iin
farkl
olabilir. En uygun aktivasyon fonksiyonunu belirlemek iin
gelitirilmi bir fonksiyon
yoktur. Toplama fonksiyonuna benzer ekilde hcrelerin hepsi iin
ayn aktivasyon
-
33
fonksiyonu kullanma zorunluluu yoktur. Bazlar ayn aktivasyon
fonksiyonunu
kullanrken bazlar kullanmayabilir [48].
Baz modeller iin zellikle de ok Katmanl Alglayc model iin bu
fonksiyon
trevi alnabilir ve srekli olmaldr. Yapay sinir alarnn kullanm
amacna gre tek
veya ift ynl aktivasyon fonksiyonu kullanlabilir.
Dorusal olmayan fonksiyonlarn kullanlmas yapay sinir alarnn
ok
karmak ve farkl problemlere uygulanmasn salamtr. En ok kullanlan
aktivasyon
fonksiyonlar unlardr [23,26,29,48,53]:
2.1.2.5.4.1. Dorusal Fonksiyon
Dorusal fonksiyon, hcreye gelen girileri olduu gibi ka
verir.
Fonksiyonun ekli ekil 2.9da verilmitir. ounlukla ADALINE olarak
bilinen
dorusal modelde, klasik iaret ileme ve regresyon analizinde
kullanlr. Denklemi;
n
i ii
v x w= veyan
i ii
v x w q= + olmak zere;
( )y F v Av= = (2.9)
Formldeki A sabit katsaysdr.
ekil 2.9. Dorusal veya Lineer Fonksiyon
-
34
2.1.2.5.4.2. Basamak Fonksiyonu
Basamak fonksiyonu tek veya ift kutuplu olabilir. Bu
fonksiyonlarn ekli ekil
2.10de, matematiksel ifadeleri de aada verilmitir. Perceptron
(Basit Alglayc
Model) olarak bilinen yapay sinir hcresi aktivasyon fonksiyonu
olarak bu fonksiyonu
kullanr.
1 0( )
0 0v
y F vv = =
-
35
ekil 2.11. Tek kutuplamal Basamak Fonksiyonu
ift kutuplu basamak fonksiyonu ise;
1 . 0( )
1 . 0w x
y F vw x
+ = = -
-
36
fonksiyon basamak fonksiyonu gibi davranr. Aadaki denklem
fonksiyonu, ekil
2.13de grafii gsterilmitir.
0 1/ 2( ) 1/ 2 1/ 2
1 1/ 2
vy F v v v
v
aa a
a
= = +
-
37
ekil 2.14. Sigmoid Tipli Fonksiyon
2.1.2.5.4.6. Tanjant Hiperbolik Tipli Fonksiyon
Uygulamalarda ok kullanlan aktivasyon fonksiyonlarndan biri de
Tanjant
Hiperbolik fonksiyondur. Bu fonksiyon ift kutuplu fonksiyon
olarak da bilinir. Giri
uzaynn geniletilmesinde etkin bir ekilde kullanlan bir
fonksiyondur. Fonksiyonun
ekli ekil 2.15de forml ise aadaki gsterildii gibidir.
2
2
1 tanh( )1
v
v
ey ve
b--= =
+ (2.15)
ekil 2.15. Tanjant Hiperbolik Tipli Fonksiyon
-
38
2.1.2.5.4.7. Sins Tipli Fonksiyon
renilmesi dnlen olaylar sins fonksiyonuna uygun dalm
gsteriyorsa
bu gibi durumlarda aktivasyon fonksiyonu olarak sins fonksiyonu
kullanlr.
Fonksiyonun ekli ekil 2.16de ve forml aada verilmitir.
( ) ( )y f v Sin v= =(2.16)
ekil 2.16. Sins Tipli Fonksiyon
Bir yapay sinir ann bu 5 temel eleman dnda zaman zaman
ihtiya
duyulduunda kullanlan bir eleman daha vardr. Bu eleman lekleme
ve snrlama
olarak adlandrlr.
2.1.2.5.5. k levi
ks y = f(v), aktivasyon fonksiyonunun sonucunun d dnyaya veya
dier
sinirlere gnderilmesidir. Bu sinirin ks kendine ve kendinden
sonra gelen bir ya da
daha fazla sayda sinire giri olabilir.
2.1.2.6. A Girilerinin Hesaplanmas in Matris arpma Metodu
-
39
Sinir alarnn balantl arlklarn W = (wij) matrisinde kaydedelim.
Bu
halde, Yj nin a girdisi x = ( x1,..., xi, ...,xn) vektrnn w.j
arlk matrisinin j. kolonu
ile (eer j. elemanda sapma yoksa) basit bir arplmas ilemi ile
gerekletirilir :
1
. 1_ . .j i ijiy in x w x w== = S (2.17)
Sapma
Sapma deeri, x vektrne x0 = 1 deeri eklenerek
oluturulabilir.
x = (l, x, ..., xi, ..., xn)(2.18)
Sapma ayn dier arlklar gibi davramr, yani w0j = bj dir. Yj
birimi iin a
girdisi u ekilde hesaplanr:
. 01 1 1
_ . . . .n n n
j j i ij j i ij j i iji i
y in x w x w w x w b x w+= =
= = = = + (2.19)Bir YSA dmnn grevi, giriindeki saylar kendi arlk
deerleri ile
arpp, sonra da bu arpmlar toplayp, toplam bir yumuatma
fonksiyonundan
(genelde sigmoid 1( )1 x
f xe-
= + veya tanh) gerdkten sonra ka vermektr. Ancak
giri ve k katmanndaki nronlar bu kuraln dndadr. Giri katmanndaki
nronlar
ise sadece kendi girilerindeki verilerin uygun arlklarla arplm
durumlarn
toplayp saklarlar. Bu ileme ilerleme denir [58,60].
2.1.2.7. Yapay Sinir Hcresinin alma Prensibi
ekil 2.17da girileri ve arlklar verilmi olan bir yapay sinir
hcresinin
almas yledir:
-
40
ekil 2.17. Yapay Sinir Ann alma rnei
Hcreye gelen net girdi, arlklarla giriler arplarak aadaki gibi
hesaplanr.
NET Girdi = 0.7 * 0.2 + 0.4 *(-0.2) + 0.3*0.1
NET Girdi = 0.14 - 0.08 + 0.03
NET Girdi = 0.09
Hcrenin sigmoid tipli aktivasyon fonksiyonuna gre k y=f(v)
yledir;
y = f(v) = 1 / (1+e-0.09)
y = 0.52
Sonuta verilen girdilere karlk yukardaki ilemler sonucunda y k
deeri
bulunur.
-
41
ekil 2.18 YSA de Kullanlan Geri Yaylml renme Algoritmas
-
42
2.1.3. Lojistik Regresyon Analizi
Lojistik regresyon; baml deikeninin kategorik ve ikili, l ve
oklu
kategorilerde gzlendii durumlarda bamsz deikenlerle neden sonu
ilikisini
belirlemede yararlanlan bir yntemdir. Bamsz deikenlere gre
baml
deikeninin beklenen deerlerinin olaslk olarak elde edildii bir
regresyon
yntemidir. Basit ve oklu regresyon analizleri baml deiken ile
bamsz deiken
ya da deikenler arasndaki matematiksel banty analiz etmekte
kullanlmaktadr. Bu
yntemlerin uygulanabilecei veri setlerinde baml deikenin normal
dalm
gstermesi, bamsz deikenlerinde normal dalm gsteren toplum ya
da
toplumlardan ekilmi olmas ve hata varyansnn ),0(2se N@
parametreli normal
dalm gstermesi gerekmektedir. Bu ve benzeri koullarn yerine
getirilmedii veri
setlerinde basit ya da oklu regresyon analizleri uygulanamaz.
Lojistik regresyon
analizi, snflama ve atama ilemi yapmaya yardmc olan bir
regresyon yntemidir.
Normal dalm varsaym, sreklilik varsaym n koulu yoktur. Baml
deiken
zerinde bamsz deikenlerin etkileri olaslk olarak elde edilerek
risk faktrlerinin
olaslk olarak belirlenmesi salanr [11,18,19,25].
Aratrclar zerinde altklar konuda ok etken olmas durumunda
etkenlerin
tek tek baml deiken zerine etkisi yannda, bunlarn birlikte
etkisini de renmek
ya da incelemek istemektedirler. Birlikte etkinin incelenmesinde
kullanlan deiik
istatistik yntemler bulunmaktadr. rnein, baml deikenin srekli,
bamsz
deikenlerin kesikli olmas durumunda varyans analizi, hepsinin
kesikli olmas
durumunda log-linear modeller, hepsinin srekli olmas durumunda
regresyon analizi
gibi. Tp alanndaki aratrmalarda ou zaman baml ve bamsz
deikenlerin tr
ve yaplar yukarda belirtilenlere benzemez, srekli ve kesikli
karm bamsz
-
43
deikenlerle karlalr. zerinde en ok durulan ve aratrc iin nemli
olan dier
bir konu da etken veya etkenlerle hastalk arasndaki ilikinin
risk ynnden
incelenmesidir. Bu tip incelemelerde arlkl olarak LRA
kullanlmaktadr [20,41].
Lojistik regresyon modelinin kullanmna ilikin ilk almalar
Berkson (1944)
tarafndan yaplm ve model Finney (1972) tarafndan biyolojik
deneylerde probit
analize bir alternatif olarak nerilmitir . Son yllarda youn bir
ekilde kullanlan LRA,
gzlemlerin gruplara atanmasnda sk kullanlan yntemden (dierleri
kmeleme
analizi ve ayrma analizi) birisidir. LRA da grup says
bilinmekte, mevcut veriler
kullanlarak bir ayrmsama modeli elde edilmekte ve kurulan bu
model yardmyla veri
kmesine eklenen yeni gzlemlerin gruplara atanmas mmkn
olabilmektedir [42].
Dorusal regresyon analizinde baml deikenin deeri tahmin
edilirken, LRA
da baml deikenin alaca deerlerden birinin gerekleme olasl tahmin
edilir.
Bu olaslk deerinin tahmininde aadaki model kullanlmaktadr.
( )0 1
0 11
x
x
exe
b b
b bp+
+= + (2.20)
Lojistik regresyon modeliyle tahmin yaplaca genel olarak
kullanlan yntem
en ok olabilirlik metodudur. Genel anlamda en ok olabilirlik
metodu, gzlenen veri
kmesini elde etmenin olasln maksimum yapan bilinmeyen
parametrelerin
deerlerini tahmin etmede kullanlr. Bu metodu uygulayabilmek iin
en ok olabilirlik
fonksiyonunun oluturulmas gerekmekte ve ilgili parametrelerin en
ok olabilirlik
tahmincileri, fonksiyonu maksimum yapacak deerleri bulacak
ekilde seilmelidir [6].
LRA da gzlenen deerlerle tahmin edilen deerler aadaki
ifadeyle
karlatrlr.
2ln Su andaki ModelinolabilirligiDDoymus Modelinolabilirligi
= - (2.21)
-
44
Modelde bulunan herhangi bir bamsz deikenin nemliliine karar
vermek
iin denklemde o bamsz deikenin bulunduu ve bulunmad durumlardaki
D
deerleri, G istatistii kullanlarak karlatrlrlar. G istatistii p
serbestlik derecesiyle
ki-kare dalm gsterecektir.
G = D(Deikensiz model iin) - D(Deikenli model iin)
2ln Degiskensiz ModelinolabilirligiDDegiskenli
Modelinolabilirligi
= - (2.22)
Katsaylarn nemlilikleri test edildikten sonra katsaylarn
yorumlanmas odds
oranlar kullanlarak yaplmaktadr. LRA nn kullanm amalarndan en
nemlisi tp
biliminde sklkla karlalan baml deikenin iki ya da daha ok dzey
ierdii,
bamsz deikenlerin ise hem kesikli hem de srekli olabildii
durumlarda verilerin
ait olduklar gruplara en doru ekilde atayacak ve hastalklara
ilikin risk faktrlerini
belirleyebilecek modeli kurmaktr. Bunun yannda lojistik
regresyon, baml
deikenin tahminini olaslk olarak hesaplayarak olaslk kurallarna
uygun snflama
ilemi yapma olana vermektedir [20,23,43].
2.1.3.1. Lojistik Snflandrma ve Lojistik Regresyon Modeli
Baml deikenin 0.1 deerlerine karlk gelen G1 ve G2 gruplar
x1,x2,...,xp
bamsz deikenlerine dayanlarak snflandrlmak istensin. Gruplardaki
birey says
sra ile n1 ve n2 olduunda, N=n1+n2 gzleme dayal snflandrma
kuralnn oluumu
fs(x1,x2,...,xp) eklindeki olaslk fonksiyonunun fonksiyonel
yapsna ilikin
varsaymlara dayanr. Fonksiyon yaps iin tr varsaym sz konusudur
[13,14,44].
i. ok deikenli normal dalm fonksiyonu
ii. Lojistik snflandrma fonksiyonu
-
45
iii. Dalmdan bamsz kernel snflandrma fonksiyonu
Lojistik snflama fonksiyonu sz konusu olduunda X0=l iken
fs(x1,x2,...,xp),
Gs(s=l,2) grubunun olaslk younluk fonksiyonu olarak tanmlanr.
Lojistik varsaym,
'=( o, ...., p) iin,
1 1
2 2
( ) ( )exp( ) ln( ) ( )
f x f xX ya da Xf x f x
b b = = (2.23)
eklinde tanmlanmaktadr. Bu son eitlik log-olabilirlik oram olup
x ler
dorusaldr. Lojistik varsaym bilinmeyen P parametrelerini
iermektedir. Her bir
gzlem iin X koulu altnda gruplardan birine atanma olasl olarak
tanmlanan
sonsal olaslklar hesaplamak iin P tahminleri gerekmektedir.
Bunun iin lojistik
varsaym altnda rneklemin olabilirlik fonksiyonu belirlenmelidir.
Kark
rneklemede gzlemler (X,G) bileik dalmndan rneklenmekte yani
gzlemler hangi
gruptan olduu bilinmeksizin rasgele seilmektedir. Buradan G grup
yeliini gsteren
deiken olup iki grup olduunda G1 ve G2 eklinde gsterilmektedir
[44].
Koullu rneklemede G nin x koulu altnda dalm incelenmektedir.
Biyolojik deneylerin analizinde ok sk kullanlan bu rnekleme trne
ilikin
olabilirlik fonksiyonu dier rnekleme trlerinin olabilirlik
fonksiyonuna temel tekil
etmektedir. Ayr rnekleme de ise x in G koulu altnda dalmndan
rnekleme
yaplmaktadr. Anderson (1972, 1982) tarafndan detayl olarak
incelenen bu rnekleme
trnn uygulamas zor olup gemie ynelik (retrospective)
almalarda
uygulanmaktadr [41].
Regresyon problemlerinde anahtar deer, verilen bir bamsz deiken
deerine
bal olarak baml deikenin ortalama deerini bulmaktr. Bu deer
koullu ortalama
olarak adlandrlr ve E(Y \ x) ile gsterilir. Burada ynin baml
deikeni, x in ise
-
46
bamsz deikeni gsterdii varsaylsn. E(Y\ x) ifadesi x deeri
verildiinde, y nin
beklenen deeri ni gstermektedir. Dorusal regresyon analizinde,
koullu
ortalamann, x in dorusal bir denklemi olduu varsaylr.
0 1( \ )E Y x xb b= + (2.24)
Yukardaki bu ifadeden, xin aralnn - ve + arasnda deimesinden
dolay,
E(Y\ x)in mmkn olan her deeri alabilecei grlmektedir. Baml
deiken ikili
olduu zaman koullu ortalama, sfrla bir arasnda deimek zorundadr
[44].
[0 < E(Y\ x ) 1]. x deki her birim deime sonucunda E(Y\ x)de
oluan deiiklik,
koullu ortalama 0a ya da 1e yaklatka ilerleyerek az olur.
ki dzey ieren bir baml deikenin analizinde kullanlmak zere
nerilen
birok dalm fonksiyonu bulunmutur [6]. Lojistik dalm kullanldnda
gsterimi
kolaylatrmak iin, x bilindiinde Y nin koullu ortalamasn gstermek
iin (x) =
E(Y\ x) ifadesi kullanlmaktadr. Kullanlacak lojistik regresyon
modelinin ak ekli
aadaki gibidir [6,16,17,44].
( )0 1
0 11
x
x
exe
b b
b bp+
+= + (2.25)
Lojistik regresyon almasna merkez olacak (x)in bir
transformasyonu
yukarda bahsedildii gibi lojit transformasyondur. Bu
transformasyon (x)cinsinden
tanmlanrsa:
( )( ) ln1 ( )
xg xx
pp
= - 0 1xb b+= (2.26)
Lojit g(x) parametreleri bakmndan dorusal ve xin ald deerlere
bal
olarak - ve + arasnda deimektedir [25].
-
47
2.2. PROSTAT KANSER
2.2.1. Prostat Kanseri Hakknda Genel Bilgi
Prostat kanseri erkeklerde en yaygn grlen kanser trdr ve
ngiltere ve
Gallerde yeni tan konulan kanser olgularnn %25ini tekil eder.
Prostat bezesinin
kt huylu tmr demek olan prostat kanseri, Robert Koch Enstitsnn
en yeni
tahminlerine gre Almanyada erkeklerde en sk rastlanan kanser
hastaldr. 2000
ylnda bu hastala ilk defa yakalananlarn says yaklak 40.000
kiiydi, yaklak
11.000 kii de bu hastalk yznden hayatn kaybetti.
Prostat kanserinin nasl ve neden ortaya kt sorusu bugne kadar
tam olarak
cevaplandrabilmi deildir. lke olarak ya ilerledike prostat
kanseri riski de
artmaktadr. 50 yan altndaki erkekler seyrek olarak hastalanr, en
yksek hastalanma
oranlar 70 yan stndeki erkeklerde grlmektedir.
Kiinin kendi babas, erkek kardeleri veya byk babalar prostat
kanserine
yakalanm ise daha yksek bir risk var demektir. Bu nedenle kaltm
yoluyla geme
veya en azndan genlerden kaynaklanan bir hastalanma eiliminin
mevcut olduu
tahmin edilmektedir.
te yandan prostat kanserine yakalanm olan erkeklerin % 80inde
herhangi bir
akrabada prostat kanseri grlmemitir. Beslenme biiminin de bir
rol oynad
ynnde iaretler vardr.
2.2.2. Prostat Nedir?
Prostat erkein en nemli cinsel salg bezesidir. Prostat bezesi,
mesanenin (idrar
torbasnn) idrar yoluna baland yerde, idrar borusunu epeevre
saran bir organdr.
Birok erkekte yan ilerlemesiyle prostatn idrar yolunun hemen
yanndaki i
-
48
blmnde iyi huylu bir tmr oluur. Prostat 60 yandaki bir erkekte
ortalama 30 ila
40 ml byklktedir. Bu, yaklak iki ceviz bykl demektir. Bu iyi
huylu ve prostat
hiper plazisi (ar byme) ad verilen byme idrar yolunu daraltarak
idrar yapmada
zorluklara sebep olabilir.
Buna karlk prostat kanseri ounlukla prostatn makattan (gden
barsa
veya rektum) parmakla eriilebilen d blmnde oluur. Prostat
karsinomlarnn
yaklak % 80i prostat bezesinin bu d blmnde ortaya kar. Prostat
kanserinin
prostat bezesinin i blmnde veya pubis kemiinin arkasnda yer alan
n ksmnda
olumas enderdir.
2.2.3. Tehis
pheli bir durum ortaya ktktan sonra prostat kanseri tehisi
koyulabilmesi
iin bir dizi muayene daha yaplmas gerekir. Bunlar:
2.2.3.1. Prostatn Parmakla Muayenesi
Prostat bezesi makattan (gden barsa veya rektum) parmakla
yoklanarak
muayene edilebilir. Normal olarak prostat (el gergin tutulduunda
insann elinin ayas
gibi) yumuak ve esnektir. Prostat kanseri ise ounlukla kemik
gibi serttir. Bu sayede
tecrbeli bir doktor prostat kanserini parmakla yoklayarak
bulabilir ve dmn
bykln tahmin edebilir. Eer parmakla yoklandnda bir dm
hissediliyorsa
tmr ounlukla prostat kapslne de yerlemi veya prostat kapsln
delip gemi
demektir.
2.2.3.2. Prostata zg Antijenin Belirlenmesi (PSA)
Prostat meni svsnn byk blmn reten organdr. Bu meni svs iinde
meni svsn akkan hale getirmeye yarayan bir protein vardr. Sz
konusu proteine
prostata zg antijen denir, bunun ksaltmas da PSAdr. PSA normal
artlar altnda da
-
49
kana karabilir ve kandaki miktar PSA testi ile llebilir. Ya
ilerledike prostat
bydnden kandaki PSA miktar da ykselir. Her gram iyi huylu
prostat dokusu
bana aa yukar 0,3 ng/ml antijen bulunur. Buna karlk prostat
kanseri her gram
doku bana yaklak 10 kere daha fazla PSA retir. Bu yzden PSA
prostat kanserinin
tehis edilebilmesi iin, yani tmr belirteci (tmr markeri) olarak
kullanlmaya,
uygundur.
Tablo 2.4 Yaa zg Normal Serum PSA Deerleri
YA PSA
40-49 0-2,5 ng/ml
50-59 0-3,5 ng/ml
60-69 0-4,5 ng/ml
70-79 0-6,5 ng/ml
2.2.3.3. Makattan (rektum) Ultrason Muayenesi (TRUS)
Ultrason muayenesi ile vcudun i organlarn, ua yk yklemeden
grntlemek mmkn olmaktadr. Prostatn deerlendirilmesi iin makata
(rektum
veya gden barsa da denir) ufak bir ubuk biiminde bir sonda
sokulur. Bylece
prostatn yalnzca bykl ve biimi deil, prostatn doku yaps ve eer
mevcutsa,
kt huylu doku deiikliklerinin olup olmad da grlebilir. Ancak
prostat kanseri
iin tipik olan doku deiiklikleri ou kereler ancak byke tmr
dmlerinde
grlebilmektedir. Bunun tesinde, ultrason ile grntleme yntemi
prostattan hedefli
olarak doku alabilmek iin de gayet yararldr [62, 63, 64].
-
50
3. GERE ve YNTEM
Uygulama verisi olarak, Tokat Gaziosmanpaa niversitesi Tp
Fakltesi
Hastanesinde 01.01.2005 tarihi ve 31.05.2011 tarihleri arasnda
roloji Polikliniine
bavuran hastalarn sonular alnmtr. Veritaban ynetim sistemi
Oracle 10 GR2 olan
hastane veritabanndan Structured Query Language (SQL) veritaban
sorgu dili
kullanlarak gerekli bilgiler ekilmitir. Belirtilen tarihler
arasnda roloji Polikliniine
bavurup muayenesi ve tetkikleri yaplp kesin tan olarak C61,
Prostat malign
neoplazm (prostat kanseri) tans konulan hastalarn muayene
bilgileri incelenmitir.
ncelenen muayene bilgileri ierisinde prostat kanserini tehis iin
kullanlan drt faktr
incelenmitir. Bu faktrler;
i. Ya,
ii. Prostatn parmakla muayenesi (rektal tue),
iii. Genetik yatknlk bilgisi ve
iv. PSA dzeyidir.
ncelenen hastalardan kesin tans prostat kanseri olup muayene
notlar ierisinde
yukarda sralanan faktrlerin hepsinin bulunduu hastalar
seilmitir. Bu ekilde
yaplan tarama sonucunda 118 hasta verisi tespit edilmitir. Ayn
ekilde muayene
notlar ierisinde ya, rektal tue, genetik yatknlk ve PSA tetkik
sonucu bulunan ama
kesin tans C61, Prostat malign neoplazm (prostat kanseri)
olmayan 118 hasta daha
seilerek toplam 236 hastalk veri setine ulalmtr.
Veri setinin WEKA programna yklenebilmesi iin arff formatnda
olmas
gerekmektedir. WEKA program Arff Viewer seenei ile .cvs uzantl
dosyalar
aabilmektedir. Bu nedenle, ncelikle MS Excel ortamda edinilen
veriler .xls
-
51
formatndan .cvs (comma-separeted variables) (virglle ayrlm
veriler) formatna
dntrlmtr. Bu format trndeki veriler Ek-1de sunulmutur
Veri madencilii algoritmalarndan Lojistik Regresyon Analizi
(LRA), Yapay
Sinir Alar (YSA) Ve Snflandrma Ve Regresyon Aalar (C&RT)
yntemlerinin
karlatrlmas iin prostat kanseri verileri kullanlmtr.
3.1. C&RT ALGORTMASI
Bilimsel almalardan elde edilen verilerin analizinde snflama ve
regresyon
aalar, kmeleme, ayrma ve lojistik regresyon analizlerini ieren
snflama
yntemleri ve regresyon modelleri sklkla kullanlmaktadr [36].
Ancak bu tr
modellerin gerektirdii varsaymlar pek ok alanda istatistiksel
analiz olanaklarn
kstlamaktadr. ncelenen veri seti zerinde hibir varsaym
gerektirmemesi nedeniyle,
snflama ve regresyon aalar (C&RT) bu tr parametrik yntemlere
kar gl bir
alternatif olarak ortaya kmaktadr [32].
Breiman ve arkadalar tarafndan 1984 ylnda gelitirilen ok
saydaki
aklayc (x) deikeni ile yant (y) deikenine karar vermede
kullanlan istatistiksel
bir tekniktir. C&RT hem kategorik hem de srekli deikenleri
kullanarak snflama ve
regresyon problemlerinin zmnde karar aalarn kullanan parametrik
olmayan
istatistiksel bir metottur. Ele alnan baml deiken kategorik ise
yntem snflama
aalar (Classification Tree), srekli ise regresyon aalar
(Regression Tree) olarak
adlandrlmaktadr [37]. Bu ynyle C&RT, hem oklu regresyon
analizini hem de
baml deikenin kategorik olduu durumlarda kullanlan lojistik
regresyon analizini
kapsamaktadr.
-
52
Yaplan almalarda kullanlan C&RT algoritmas, her aamada
ilgili kmeyi
kendinden daha homojen olan iki alt kmeye ayrarak ikili karar
aalar oluturan bir
yapya sahiptir. Dier bir ifadeyle C&RT, iki yavru dm
oluturup btn bamsz
deikenleri kullanarak veriyi alt gruplara ayrmak zerine
kurulmutur. En iyi bamsz
deiken safszlk (impurity) ve deiim llerindeki (gini, twoing, en
kk kareler
sapmas) deikenlii kullanarak seilir. Burada ama hedef deikene
ilikin mmkn
olabilen en homojen veri alt gruplarn retmektir [5].
C&RT, sadece baml deiken ile bamsz deiken arasndaki
ilikinin
yapsn aratrmakla kalmayp, ayn zamanda bamsz deikenlerin
birbirleri ile olan
etkileimlerini de ortaya koymaya almaktadr. C&RT
algoritmasnn, bamsz
deikenlerin baml deikenle ilikisini deerlendirmede ve model
iindeki etkileim
yapsn zmlemede nemli avantajlar mevcuttur [37,38].
C&RTn sahip olduu algoritma, benzerlik gsteren deikenlerin
ayn aa
dmnde toplanmasna dayal olup, btn oluturduu alt dallar baml
deiken
olan kk dme balamayla son bulmaktadr [38]. C&RT analizi
genellikle 3 admdan
olumaktadr. Birinci adm veri setini tanmlayan maksimum aacn
oluturulmasdr.
kinci adm; oluturulan aalar ierisinden baml deikenle nemli
ilikisi olan
aalar semek iin yaplan budama ilemi ve son adm ise en uygun aa
yapsnn
seimidir [37].
3.1.1. Maksimum Aacn Oluturulmas
Maksimum aa, aacn kknde balayan bir ikili blme ilemi
kullanan
yapdr. Aacn kk, veri seti ierisindeki her nesneyi iermekte ve
her bir seviyede
kendine zg iki alt dm halinde blnen bir ana dm olarak
dnlmektedir.
-
53
Sonraki admda, her alt grup bir ana grup olmaktadr. Her blnme
bir alt gruptaki tm
nesnelerin benzer baml deiken deerlerine sahip olacak ekilde
seilen bir
aklaycnn deeri ile tanmlanmaktadr [37,38].
Srekli deikenlerin blnmesi xinin seilmi bamsz deiken ve a
jnin
onun blnme deeri olan x i < aj ile ifade edilmektedir.
Bir blnme ve onun blnme deeri iin en uygun tanmlaycy semek
iin
C&RT, iinde tm tanmlayclarn ve tm blnme deerlerinin dnld
bir
algoritma kullanmakta ve test koulunun ne kadar iyi uygulandn
belirlemek iin ana
dmn safszlk derecesini alt dmlerin safszlk derecesiyle
karlatrmaktadr.
Ana ve alt dmlerin safszlklar arasndaki fark ne kadar bykse test
koulu o kadar
daha iyi olduundan, ana dm (tp) ve alt dmler (tL ve tR)
arasndaki safszlk
lsn en iyi azaltan blnme seilmektedir. Matematiksel olarak bu
durum aadaki
gibi ifade edilmektedir [37]:
i(s, tp ) = ip (tp ) - PLi(tL) - PRi(tR) (3.1)
Burada i safszl, s aday blnme deerini ve PL ile PR srasyla sa ve
soldaki
alt dmlerdeki nesnelerin blnmelerini ifade etmektedir. Bu
eitlikte i(s, t )
deerini maksimize edecek s deerinin seilmesi amalanmakta ve tp
dmnde
btn kaytlarn katlmyla hesaplanan bu deer, C&RT aacnda
gelime
(improvement) kavram ile ifade edilmektedir. C&RT algoritmas
aac gelitirirken
i(s, tp ) yi maksimize eden bir test koulu setiinden ve ip(tp )
btn test koullar
iin ayn olduundan, i(s, tp ) yi maksimize etmek alt dmlerin
safszlk llerinin
arlkl ortalamalarn minimize etmekle edeer olmaktadr [37].
-
54
Her bir dmn her aamada ikiye ayrld C&RT algoritmasnda, her
bir
blnme noktasnn belirlenmesinde Gini, Twoing gibi en iyi blmeyi
semek iin
gelitirilen sz konusu safszlk ltlerinden Gini indeksi
kullanlmaktadr. Gini
indeksi aadaki gibi hesaplanmaktadr [40].
1) Her nitelik deerleri ikili olacak biimde gruplanmakta ve bu
ekilde elde edilen
sol ve sa blnmelere karlk gelen snf deerleri
gruplandrlmaktadr.
2) Her bir nitelikle ilgili olarak sol ve sa taraftaki blnmeler
iin Ginisol ve
Ginisa deerleri;
k: Snflarn says,
T: Bir dmdeki rnekler,
Tsol: Sol dmdeki rneklerin says,
Tsa: Sa dmdeki rneklerin says,
Li: Sol dmde i kategorisindeki rneklerin says.
Ri: Sa dmde i kategorisindeki rneklerin says olmak zere;
Ginisol = 1-2
1
ki
i sol
LT=
,
Ginisa = 1-2
1
ki
i sol
LT=
,
eklinde hesaplanmakta ve her j nitelii iin, eitim verisindeki
satr says n olmak
zere genel Gini indeks deeri ise;
Ginij = ( )1 sol sol sag sagT Gini T Ginin + forml ile
hesaplanmaktadr.
-
55
3.2. YAPAY SNR AI MODELLER
Sinir alar, tek katmanl ya da ok katmanl olarak snflandrlrlar.
Katman
saysn belirlerken, girdi birimi bir katman olarak saylmaz; nk
bunlar zerinde
hibir hesaplama ilemi yaplmaz.
3.2.1. Tek Katmanl Alglayclar
Tek katmanl yapay sinir alar giri ve k katmanlarndan oluur.
Girdi ve
kt katmanlarnda birden fazla giri ve k deeri bulunmaktadr. Giri
katmanndaki
her giri deerini k katmanna balayan sinaptik balantlar
mevcuttur. Her balant
bir arlk deerine sahiptir. Ayn zamanda an ktsnn sfr olmasn
engelleyen bias
sapma deeri mevcuttur.
Tek katmanl YSA rnek snflandrma, tanma, rnek ilikilendirme ve
bunun
gibi dier problemlerin zlmesinde kullanlabilir. rnek
snflandrma
problemlerinde, her giri vektr (rnek, numune) belirli snflara
ait olabilir ya da
olmayabilir. Basit olarak, bir snfa ye olma sorusu gz nnde
bulundurulur. k
birimi iin +1 cevabnn alnmasyla rnein o snfa ye olduu, -1 cevab
alnrsa,
rnein o snfa ye olmad belirlenir. Bu tip durumlarda, her bir snf
iin bir k
birimi vardr. rnek tanmlama, rnek tanma uygulamasmn bir eididir.
rneklerin
ilikili hatrlanmas ise daha farkldr [6].
Aada ekil 3.5 de tek arlk katmanl YSA iin rnek verilmitir. Bu a
ileri
beslemeli alara birer rnektir.
-
56
ekil 3.1. Tek Arlk Katmanl Bir Yapay Sinir A
Tek katmanl sinir alarnn eitilmesinde nemli yntem vardr:
Hebb Kural
Perseptron renme Kural
Delta Kural
3.2.1.1. Hebb Kural
Hebb kural, bir yapay sinir a iin, en eski ve en basit renme
kural olarak
bilinir. Hebb, renmenin, sinaps uzunluklarn (arlklar) deitirerek
meydana
geleceini nermitir. Hebbe gre, eer birbiri ile bal iki nronun
her ikisi de ayn
zamanda aktif ise, bu nronlara uygun arlklarn artrlmas
gerekmektedir. Benzer
olarak, eer her iki nron ayn zamanda pasif ise, arlklarn
artrlmas gerekir. Bu
-
57
durumda, daha gl bir renme ekli meydana gelir. Gelitirilmi Hebb
kural ile tek
katmanl ileri beslemeli bir sinir ann eitilmesi bir Hebb an
anlatr. Hebb kural,
dier zgl alar eitmek iin de kullanlabilir. Tek katmanl bir yapay
sinir anda
birbiri ile balantl nronlardan bir tanesi giri birimi, bir
tanesi de k birimi
olacaktr (hibir giri birimi birbiri ile balanmad iin, herhangi
bir k birimleri de
birbiri ile bal deildir [48,59].
3.2.1.2. Perseptron
Perseptronlar, YSAnn renebilir niteliini tayan ilk modelidir.
Hebb
kuralndan daha yetenekli bir renme kuraldr. Perseptron tekrarl
renme
algoritmasdr ve zmn varl durumunda yaknsama niteliine sahiptir.
Bu,
perseptron modelinin en nemli zelliklerinden biridir.
Rosenblatt (1962) ve Minsky-Papert (1969, 1988) tarafndan eitli
perseptron
modelleri tanmlanmtr. Orijinal perseptronlar, duyumsal birimler,
birletirici birimler
ve cevap birimleri olmak zere nronlarn durumuna sahiptirler.
rnein, bir basit
perseptron duyumsal ve birletirici birimler iin ikili
aktivasyon, cevap birimi iin ise
+1, 0, veya -1 deerlerini reten aktivasyon uygulayabilir.
Snflandrma problemlerinde eik deerli aktivasyon fonksiyonu
kullanlr:
1, _( _ ) 0, _
1, _
y in isef y in y in ise
y in ise
qq q
q
- < -= - > (3.2)
kt biriminin aktivasyonu y = f(y_in) eklinde hesaplamr.
Birletirici birimden cevap birimine giden balantlarn arlklar
perseptron
renme kural ile ayarlamr. Her eitim girii iin, sinir a, k
biriminin cevabn
-
58
hesaplar. Daha sonra sinir a, bu rnek iin k deeri ile hedeflenen
k arasndaki
fark karlatrarak bir hata oluup olumadn tespit eder. Yapay sinir
a,
hesaplanm k deeri 0 ve hedef deeri -1 olan rnek iin hatay ayrt
edemez,
buna kart olarak hesaplanm k deeri +1 ve hedef deeri -1 olan
rnek iin
hatay ayrt edebilir. Bu durumlarda, hedef verinin iareti ynnde
arlklarn iareti
deitirilmelidir. Bununla birlikte k birimine 0 olmayan sinyaller
gnderen
balantlANN arlklar ayarlanmaldr. Eer belirli bir eitim giri
rneinde hata
oluuyorsa, arlklar
( ) ( )i i iw yeni w eski txa= + (3.3)
formlne gre deitirilmelidir.
Burada hedef deeri t ya +l ya da -ldir ve a renme oran
katsaysdr. Eer
hata olumadYSA arlklar deitirilmemelidir. Eitim ilemi hata
olumayncaya
kadar devam etmelidir. Perseptron renme kural yaknsama teoremine
gre, eer ada
tm eitim rnekleri iin uygun arlklarn varlna izin verilirse, bu
arlklar, eitim
srecinde btn eitim rnekleri iin elde edilebilir. Bu kuraln amac,
an tarn olarak
doru cevap veremedii eitim rnekleri iin arlklar ayarlamaktr.
Ayrca, eitim
sonunda bu a snrsz saydaki eitim admlar iin arlklarn deerlerini
bulmaldr
[4,7,50].
3.2.1.2.1. Perseptron Algoritmas
ekil 3.6de perseptronun mimarisi gsterilmitir. Burada X1 ,...,
Xn girdi
birimleri, Y kt birimi ve 1 sapma sinyalidir. b sapma arl, wi (i
= 1,...,n)
arlklardr.
-
59
ekil 3.2. Basit Bir Perseptron Mimarisi
Snflandrma problemlerinde, sinir ann grevi tm giri rneklerinin
belirli
bir snfa ait olup olmamasn belirlemektir. Snfa ait olma kn +1
deerine, ait
olmama ise kn -1 deerine uygun olmasyla belirlenir. Snflandrma
ilemi
yaplabilmesi iin a, tekrarl bir teknik ile eitilir. Girdi ve
hedefler ikili ve ya iki
kutuplu olabilir. eik deeri tm birimler iin deimezdir. Sapma ve
eik deerinin
her ikisinin ayn zamanda kullanlmasna ihtiya duyulmaktadr. Bu
ilemin algoritmas
aada verilmitir. Bu algoritma, arlklarn balang deerlerine ve
renme oranna
tam olarak duyarl deildir [6].
Adm 0 Arlklar ve sapmalara balang deerleri ata.
(Arlklar ve sapma deeri kolaylk iin 0 olarak ahnabilir.)
renme oran olan (0 < < l)y ayarla. (kolaylk iin, a, le
eitlenebilir.)
Adm 1 Durma koulu yanl iken , adm 2-6' y uygula.
Adm 2 Her bir s:t renme ifti iin, 3-5 admlarn uygula.
Adm 3 Giri birimlerinin aktivasyonlANN ayarla. xi = si i = 1, .
. . , n
-
60
Adm 4 Her kt birimi iin aktivasyonlar hesapla.
_ . 1,...., :j j i iji
y in b x w j m= + =
1, _( _ ) 0, _
1, _
y in isef y in y in ise
y in ise
qq q
q
- < -= - > (3.4)
Adm 5 Arlklar ve sapmalan ayarla.
,j jeger t y ise (3.5)(3.4)
( ) ( )j j jb yeni b eski t= +
( ) ( ) .ij ij j iw yeni w eski t x= +
,j jeger t y ise
( ) ( )j jb yeni b eski=
( ) ( ).ij ijw yeni w eski=
(3.6)Adm 6 Durma koulu:
Eer adm 2de hi bir arlk deimezse dur; aksi duaimda devam et.
Algoritmada kt birimlerinin says m = 1 olabilir. rnein, mantksal
fonksiyonlar
gzden geirirken kt biriminin saysnn bir olduu kabul edilir.
Eitimden sonra, a
her bir eitim vektrn doru ekilde snflandrr.
Snflandrma ile ilgili perseptron eitim algoritmasnda, ayrma
dorusu yerine,
pozitif cevaplar blgesini sfr cevaplar blgesinden ayran w1x1
+w2x2 +b > dorusu
ve negatif cevaplar blgesini sfr cevaplar blgesinden ayran w1x1
+w2x2 +b
-
61
3.2.1.2.2. Delta
Delta kural, Widrow ve Hoff (1960) tarafndan ADALINE iin ortaya
atlm
olan iteratif bir renme srecidir. Delta kuralnda, tm girdi
numuneleri iin kt ve
hedef farklar karelerinin toplamnn, baka bir ifadeyle, toplam
hatann kltlmesine
hedeflenmitir. Uygun algoritmalarda her numune iin gradient
vektrnn ters
ynnde arlklarn gncellenmesi yaplr. Bu durumda delta kural,
nron
balantlarnn arlklarn, a girii (y_in) ve an hedef k (t) arasndaki
fark en
aza indirgeyecek ekilde deitirir. Ama, tm eitim numunelerinin
hatalarn en aza
indirgemektir. Arlk dzeltmeleri, ok saydaki eitim numunesi ile
beraber
biriktirilebilir ve bu yn gncelletirilmesi olarak adlandrlr
[6].
3.2.2. ok Katmanl Alglayclar
Tek katmanl alar ayrlamayan problemlerin zmnde baarsz
olmaktadrlar. Bunun iinde bilim adamlar ok katmanl YSA
modellerini
incelemilerdir. Burada nemli aamalardan biri bu tip alar iin
akll bir eitim
algoritmasn gelitirmekti.