Line´ arn´ ı a logistick´ a regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzik´ aln´ ı fakulta Katedra pravdˇ epodobnosti a matematick´ e statistiky V´ ypoˇ cetn´ ı prostˇ redky finanˇ cn´ ı a pojistn´ e matematiky 2012 M.Branda (KPMS MFF UK) Regrese 2012 1 / 33
33
Embed
Line arn a logistick a regrese - Univerzita Karlovaartax.karlin.mff.cuni.cz/~branm1am/VPFaPM/Regrese.pdfLine arn a logistick a regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzik
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Linearnı a logisticka regrese
Martin Branda
Univerzita Karlova v PrazeMatematicko-fyzikalnı fakulta
Katedra pravdepodobnosti a matematicke statistiky
Vypocetnı prostredky financnı a pojistne matematiky2012
Predpokladame, ze matice ma plnou sloupcovou hodnost.
Kvantitativnı promenne - napr. vek, pocet aktivnıch smluv, pocetnajetych kilometru, ... Casto jsou kategorizovany kvuli nevhodnemurozdelenı, odlehlym pozorovanım nebo nelinerite vztahu mezi jimi azavisle promennou.Kvalitativnı (kategorialnı) promenne - kodovany pomocı 0-1 “dummy”promennych, napr. pohlavı, region (kraj, okres), ...Interakce - odlisny vliv regresoru pro ruzne kategorie jinehokategorialnıho regresoru.
Predpokladame, ze matice ma plnou sloupcovou hodnost.
Kvantitativnı promenne - napr. vek, pocet aktivnıch smluv, pocetnajetych kilometru, ... Casto jsou kategorizovany kvuli nevhodnemurozdelenı, odlehlym pozorovanım nebo nelinerite vztahu mezi jimi azavisle promennou.Kvalitativnı (kategorialnı) promenne - kodovany pomocı 0-1 “dummy”promennych, napr. pohlavı, region (kraj, okres), ...Interakce - odlisny vliv regresoru pro ruzne kategorie jinehokategorialnıho regresoru.
M.Branda (KPMS MFF UK) Regrese 2012 4 / 33
Data
Predpoklady
Rozdelenı Yi zavisı na xi .
Pozorovanı (Yi , xi ) jsou nezavisla.
Pozorovanı Yi jsou nezavisla a xi jsou merene konstanty - budemenadale uvazovat.
M.Branda (KPMS MFF UK) Regrese 2012 5 / 33
Data
DataV databazi/vytorena nad databazı
Y Data
Pocet skod Pohlavı Pocet obyvatel Vek(v letech)
2 muz 15 423 210 muz 1 205 321 441 zena 20 893 350 zena 580 51...
......
.... . .
M.Branda (KPMS MFF UK) Regrese 2012 6 / 33
Data
DataBez absolutnıho clenu
Y Data
Pocet skod Pohlavı Region Vekzena muz velka mala venkov (v letech)
Test vyznamnosti regresoru pri ponechanı vsech ostatnıch regresoru vmodelu (nezalezı na poradı).
M.Branda (KPMS MFF UK) Regrese 2012 23 / 33
Logisticka regrese
ROC krivka
M.Branda (KPMS MFF UK) Regrese 2012 24 / 33
Logisticka regrese
ROC krivkaReceiver Operating Characteristic
ROC krivka slouzı k posouzenı kvality modelu a nastavenı prahovehodnoty.
Na svisle ose grafu je relativnı cetnost skutecne pozitivnıch prıpaduTP, tedy pravdepodobnost, ze jako spravny bude vyhodnocenpozitivnı prıpad: Sensitivity = TP/(TP+FN).
Na vodorovne ose je relativnı cetnost falesne pozitivnıch prıpadu FP,tedy pravdepodobnost, ze jako spravny bude vyhodnocen negativnıprıpad: 1-Specificity = FP/(TN+FP).
skutecnost/predikce 1 0
1 TP FP
0 FN TN
True (T), False (F), Positive (P), Negative (N)
M.Branda (KPMS MFF UK) Regrese 2012 25 / 33
Reference
Obsah
1 Data
2 Linearnı regrese
3 Logisticka regrese
4 Reference
M.Branda (KPMS MFF UK) Regrese 2012 26 / 33
Reference
Reference
M. Denuit, X. Marechal, S. Pitrebois, J.-F. Walhin: ActuarialModelling of Claim Counts: Risk Classification, Credibility andBonus-Malus Systems. John Wiley & Sons, Chichester, 2007.
P. de Jong, G. Z. Heller: Generalized Linear Models for InsuranceData. Cambridge University Press 2008.
P. McCullagh, J.A. Nelder: Generalized Linear Models. 2nd Ed.Chapman and Hall, London, 1989.
K. Zvara: Regrese. Matfyzpress, Praha, 2008.
Zapisky z prednasky Zobecnene linearnı modely (NSTP196), MFFUK, prednasejıcı Doc. Mgr. Michal Kulich, Ph.D.