Transcript
8/13/2019 Analiza Datelor Proiect Final
1/25
Metodele si tehnicile de analiza a datelor sunt cele mai adecvate instrumente utilizabile
pentru identificarea unor structuri cauzale ce apar peste tot in jurul nostru, mai ales in mediul
economic.Procesul de analiza a datelor apare ca fiind un proces specific de transformare
informationala, proces care are ca intrari datele primare, iar ca iesiri informatii sintetizatoare.
Conceptul cel mai important si cel mai frecvent intalnit in analiza datelor, care, de fapt, intrasi in alcatuirea numelui acestui tip de activitate stiintifica, este reprezentat de data. Datele reprezinta
expresii cantitative si calitative ale unor fenomene si procese din realitatea inconjuratoare.
Proiectul de fata isi propune sa analizeze anumiti indicatori financiari ai firmelor cotate peBursa de Valori Bucuresti, cu scopul de a defini indicatorii cei mai reprezentativi care ilustreaza
performanta financiara a companiilor listate.
Datele folosite pentru analiza au preluate de pe site-ului Bursei de Valori Bucuresti si de pe
site-ul .!td.ro,pentru anul "##$ si privesc %& de companii listate pe bursa la una din cele "cate'orii. Variabilele (indicatorii financiari ai firmelor) luate in considerare au fost (pentru fiecare
firma)*
- Cifra de afaceri- +r. de salariati
- Profit net- ndice de lichiditate
- entabilitatea economica
- ndicele P (Price arnin' atio)/- ndicele P0 (arnin' per 0hare)/
Valorile initiale ale datelor folosite in analiza sunt prezentate in tabelul de mai jos*
Indicator
Cifra deafaceri (miiRON)
Nr.salariati
Profit net(mii RON) Lichiditate
Rentabilitateeconomica (%)PER EPS (RON)
Companii Simbol
1Aerostar Bacau ARS 152697.74 1609 9503.72 2.34 0.0622 7.03 0.0811
2Alro Slatina ALR 1968015.55 3908 247226.96 1.42 0.1256 3.64 0.3464
3Amonil Slobozia AMO 216879.37 859 6927.94 1.11 0.0319 2.23 0.0062
4Antibiotice asi A! 215805.95 1523 10572.76 1.82 0.049 15.49 0.0232
5Azomures !". #ures A"O 1144100.22 2494 50540.75 3.35 0.0442 1.61 0.0961
6Bermas Sucea$a !RM 23072.06 258 917.52 1.49 0.0398 7.94 0.0426
7
Casa %eBuco$ina Club %e#unte !CM 4689.44 76 650.19 1.71 0.1386 14.41 0.0039
8
C&!''
!ranselectricaBucuresti EL 2924508.22 2188 41943.08 1.28 0.0143 19.22 0.5722
9Comel( Bistrita CM# 125959.06 1096 2086.94 1.02 0.0166 53.29 0.0891
10Compa S. A.Sibiu CMP 310818.16 1840 439.64 1.35 0.0014 47.28 0.002
11Con%ma" SA COMI 145313.19 917 8890.13 2.02 0.0612 4.59 0.0514
12Contor )roup SA C$C 44533.91 376 981.91 1.19 0.022 15.38 0.0063
13*a(ora SA#e%ias A#R 269018.68 1112 2736.32 1.38 0.0102 13.91 0.0028
1
http://www.ktd.ro/http://www.ktd.ro/http://www.ktd.ro/8/13/2019 Analiza Datelor Proiect Final
2/25
14'ner"opetrolCampina ENP 23928.02 241 103.58 1.19 0.0043 31.28 0.0512
15
+lamin"onternationalBucuresti #LA 1057166.76 249 402.7 1.17 0.0004 58.04 0.0005
16
mpact *e$eloper
, Contractor S.A. IMP 151688.18 160 8258.69 2.91 0.0544 0.76 0.0413
17#ec-el!ar"o$iste COS 1107164.18 3513 106330.96 1.64 0.096 1.17 1.5444
18#e(in Sinaia ME# 27405.43 611 165 2.26 0.006 36.57 0.0312
19il !erminalConstanta OIL 134573.36 1273 1025.68 0.86 0.0076 90.86 0.0018
20/etrom SNP 16750726.46 29861 1022387.5 1.48 0.061 10.03 0.018
21/ro%plastBucuresti PPL 66132.79 279 5151.06 7.59 0.0779 24.25 0.1361
22Santierul &a$alrso$a SNO 125966.96 778 15404.01 1.87 0.1223 2.94 1.3485
23Sinteza ra%ea S" 12287.24 108 52.47 7.16 0.0043 327.58 0.0008
24Siretul /ascani SR 14224.37 373 310.18 3.67 0.0218 15.56 0.002
25S&!)&!A&S)A SA $N 1119389.99 4918 239007.09 1.72 0.2135 6.01 20.2998
26Socep Constanta SOCP 58818.01 626 7613.71 10.79 0.1294 7.22 0.0222
27!eraplast SA RP 194916.1 540 19322.14 2.12 0.0991 6.17 0.0649
28!!A& S.A. MPN 294472.57 964 9794.49 0.63 0.0333 15.85 0.024
29
!ransil$aniaConstructii SAClu COR 58939.83 347 5532.68 2.16 0.0939 3.85 7.7978
30!urism +eli S.A.Baile +eli E 55448.04 844 9639.95 1.08 0.1739 8.75 0.0194
31
!urism -otelurirestaurante#area &ea"ra E#O 39232.58 589 11811.75 8.07 0.3011 9.48 0.0612
32C# esita &CM 146012.01 2298 1095.44 0.85 0.0075 19.36 0.0116
33ae ApcaromBuzau APC 87390.13 243 2137.55 1.92 0.0245 15.19 0.029
34rancart A%u% 'NC 115072.96 989 5743.1 1.32 0.0499 6.43 0.0083
nainte de a fi utilizate in analiza, datele initiale au fost normalizate prin raportarea diferentei
dintre fiecare variabila si media sa la varianta acesteia. Valorile normalizate care au fost preluate in020 sunt prezentate in tabelul de mai jos*
+irma Cifraafaceri Nrsalariati Profitnet Lichiditate RentabeconPER EPS
ARS 10.0863775 13.14867646 10.202239 34.720389 31.481985 15.825 8.91123
ALR 9.455731048 12.69377274 8.8878534 35.111845 30.547941 15.8848 8.83906
AMO 10.06408062 13.29707915 10.216481 35.243748 31.928381 15.9097 8.93161
A! 10.06445353 13.1656933 10.196328 34.941647 31.676454 15.6756 8.92698
A"O 9.741961521 12.97356128 9.9753429 34.290639 31.74717 15.9207 8.90715
!RM 10.13140982 13.41599917 10.249713 35.08206 31.811994 15.8089 8.92171
!CM 10.13779599 13.45201156 10.251191 34.988451 30.356418 15.6947 8.93223
"
8/13/2019 Analiza Datelor Proiect Final
3/25
EL 9.123442838 13.03410958 10.02288 35.171414 32.187674 15.6098 8.77763
CM# 10.09566659 13.2501839 10.243247 35.282043 32.153789 15.0083 8.90906
CMP 10.03144602 13.10296843 10.252355 35.141629 32.377724 15.1144 8.93275
COMI 10.08894291 13.28560267 10.205632 34.856548 31.496717 15.8681 8.91931
C$C 10.12395391 13.39265048 10.249357 35.209708 32.074233 15.6776 8.93158
A#R 10.04596728 13.24701797 10.239656 35.128864 32.248077 15.7035 8.93253
ENP 10.13111245 13.41936297 10.254213 35.209708 32.334999 15.3968 8.91937
#LA 9.772162446 13.41778001 10.252559 35.218218 32.392456 14.9244 8.93316
IMP 10.08672822 13.43539046 10.209123 34.477857 31.596898 15.9357 8.92206
COS 9.754793204 12.77193149 9.6668756 35.018236 30.984024 15.9284 8.51315
ME# 10.12990439 13.34615097 10.253873 34.754429 32.309954 15.3035 8.92481
OIL 10.09267396 13.21516086 10.249115 35.350122 32.286382 14.345 8.93281
SNP 4.320176233 7.558445952 4.6019461 35.086315 31.499664 15.772 8.9284
PPL 10.1164504 13.4118439 10.226305 32.486541 31.250684 15.521 8.89627
SNO 10.09566384 13.31310664 10.169616 34.920372 30.596558 15.8972 8.56644S" 10.13515649 13.44567971 10.254496 32.669503 32.334999 10.1656 8.93308
SR 10.13448353 13.39324409 10.253071 34.154481 32.07718 15.6744 8.93275
$N 9.750545924 12.49392378 8.9333016 34.984196 29.25295 15.843 3.41079
SOCP 10.11899157 13.34318292 10.212689 31.124957 30.491957 15.8216 8.92726
RP 10.07171072 13.36019976 10.147952 34.813998 30.938354 15.8402 8.91564
MPN 10.03712453 13.27630277 10.200631 35.447986 31.907755 15.6693 8.92677
COR 10.11894925 13.39838872 10.224195 34.796978 31.014963 15.8811 6.81193
E 10.12016231 13.3000472 10.201486 35.256513 29.836359 15.7946 8.92802
E#O 10.12579561 13.35050412 10.189478 32.282303 27.962379 15.7817 8.91665
&CM 10.08870014 13.01234385 10.248729 35.354377 32.287855 15.6073 8.93014
APC 10.10906554 13.41896723 10.242967 34.899097 32.037402 15.6809 8.92541
'NC 10.09944845 13.27135602 10.223032 35.154394 31.663195 15.8356 8.93104
Analiza corelatiilor dintre variabile (descrierea bidimensionala)
%
8/13/2019 Analiza Datelor Proiect Final
4/25
mpiric, am observat existenta anumitor le'aturi intre variabilele analizate, insa 'radulcorelatiei poate fi mai bine identificat prin calculul urmatorilor indicatori*
- coeficientul de corelatie Pearson/- covarianta.
Corelatia dintre variabile conduce la redundanta informationala, lucru care poate distorsionaanaliza, precum si concluziile acesteia. 3nul dintre obiectivele analizei multidimensionale a datelor
este tocmai reducerea acestei redundante. n cazul corelarii variabilelor, reprezentarea 'eometrica a
acestora nu este una orto'onala iar interpretarea distantelor dintre obiecte in acest spatiu estealterata.
4utput-ul obtinut prin rularea pro'ramului in 020 este dupa cum urmeaza*
!-e C /roce%ure
Partial 'ariables* &rsalariati /' '/S
+ 'ariables* Ci(raa(aceri /ro(itnet entabecon ic-i%itate
Sim,le Statistics
'ariable N Mean Std e- Sm Minimm Ma/imm Partial'ariance
PartialStd e-
Label
Nrsalariati 34 13.07096 1.00000 444.41264 13.45201 7.55845 &rsalariati
PER 34 15.48001 1.00000 526.32025 15.93568 10.16564 /'
EPS 34 8.67055 1.00000 294.79873 8.93316 3.41079 '/S
Cifraafaceri 34 9.84121 1.00000 334.60103 10.13780 4.32018 0.03174 0.17815 Ci(raa(aceri
Profitnet 34 9.95317 1.00000 338.40793 10.25450 4.60195 0.02863 0.16921 /ro(itnet
Rentabecon 34 31.44546 1.00000 1069 32.39246 27.96238 0.84299 0.91814 entabecon
Lichiditate 34 34.66558 1.00000 1179 35.44799 31.12496 1.00658 1.00328 ic-i%itate
n tabloul 0imple 0tatistic, se calculeaza pentru fiecare din cele 5 variabile media,
abaterea standard, valoarea minima si maxima, varianta partiala si abaterea standard partiala.0e remarca ca pentru toate variabilele valoare 06DV71, deoarece variabilele modelului au
fost normalizate initial.
&
8/13/2019 Analiza Datelor Proiect Final
5/25
Pearson Partial Correlation Coefficients0 N 1 +Prob 2 3r3 nder 45* Partial Rho15
Cifraafaceri Profitnet Rentabecon Lichiditate
Cifra_afaceri_ 1.#####
#."%$#&
#.185"
-#.1###%
#.98"&
#.##9"1
#.855$
Profit_net #."%$#&
#.185"
1.#####
#.%:195
#.#&95
#.19:95
#.#%
Rentab_econ -#.1###%
#.98"&
#.%:195
#.#&95
1.#####
#.9981&
#.##11
Lichiditate #.##9"1
#.855$
#.19:95
#.#%
#.9981&
#.##11
1.#####
Din analiza matricea de corelatii Pearson din tabloul ;Pearson Partial Correlation
Coefficients; observam ca variabilele sunt putin corelate intre ele, sin'ura corelatie mai
puternica fiind intre entab
8/13/2019 Analiza Datelor Proiect Final
6/25
:
8/13/2019 Analiza Datelor Proiect Final
7/25
5
8/13/2019 Analiza Datelor Proiect Final
8/25
Analiza componentelor principale
2naliza componentelor principale este o tehnica de analiza multidimensionala ce urmareste
descompunerea variabilitatii din spatiul cauzal initial intr-un numar mai redus de componente/
aceste componente nu se suprapun informational si redau cu pierderi minime continutul factorilor
considerati la inceput.Pentru acest proiect analiza componentelor principale trebuie sa sintetizeze distinctiile dintre
firmele listate la bursa, existente la nivelul celor 5 factori studiati, printr-un numar mic de
componente ce au avantajul necorelarii.Componentele principale sunt combinatii liniare ale variabilelor ori'inale extrase pe criteriul
maximizarii variantei (varianta fiind o masura a cantitatii de informatie retinuta). 2ceasta
modalitate de obtinere sprijina obiectivul optimalitatii* pierderea cu care se face transformareavariabilelor initiale sa fie minima.
2m pornit de la un numar de %& de observatii pentru fiecare analizand cate 5 variabile.
ezultatele obtinute in urma rularii analizei componentelor principale in 020 sunt urmatoarele*
Re6ltate Anali6a Com,onentelor Princi,ale
Obser-ations 34
'ariables 7
Media si varianta pentru fiecare dintre cele 5 variabile sunt redate in tabelul de mai jos*
Sim,le Statistics
Cifraafaceri Nrsalariati Profitnet Lichiditate Rentabecon PER EPS
Mean 9.841206729 13.07096000 9.953174291 34.66557540 31.44545654 15.48000741 8.670550923
St 1.000000000 1.00000000 1.000000000 1.00000000 1.00000000 1.00000000 1.000000000
Matricea de covarianta este redata in tabelul de mai jos. 0e remarca ca varianta totala este
e'ala cu numarul de variabile, respectiv 5.
Co-ariance Matri/
Cifraafaceri Nrsalariati Profitnet Lichiditate Rentabecon PER EPS
Cifraafaceri 1.000000000 0.982417621 0.966643680 0.116063880 0.005245987 0.075948423 0.000776150
Nrsalariati 0.982417621 0.999999999 0.983599602 0.126512001 0.044432509 0.095456419 0.077070303
Profitnet 0.966643680 0.983599602 1.000000000 0.105090675 0.127585829 0.101241468 0.156207488
Lichiditate 0.116063880 0.126512001 0.105090675 0.999999999 0.372595168 0.270928644 0.069740490
$
8/13/2019 Analiza Datelor Proiect Final
9/25
Co-ariance Matri/
Cifraafaceri Nrsalariati Profitnet Lichiditate Rentabecon PER EPS
Rentabecon 0.005245987 0.044432509 0.127585829 0.372595168 1.000000002 0.296137974 0.409586392
PER 0.075948423 0.095456419 0.101241468 0.270928644 0.296137974 1.000000000 0.099927176
EPS 0.000776150 0.077070303 0.156207488 0.069740490 0.409586392 0.099927176 1.000000000
otal 'ariance 7.0000000007
Componentele principale sunt ordonate in tabelul ;i'envalues of the Covariance Matrix? in
ordine descrescatoare a informatiei retinute, procent din varianta totala.n tabelul ;i'envalues of the Covariance Matrix? coloana ;Proportion? releva procentul din
informatia initiala a fiecarei variabile care se re'aseste sintetizata in componentele principaleextrase. Dupa cum putem observa, cele mai mari cantitati extrase sunt pentru Cifra din varianta totala, iar cea de-a patra
explica 1".1> din varianta totala.
0e observa ca primele % componente au valori proprii mai mari decat 1 (Coloana
ei'envalue), acestea sunt retinute pentru analiza. le cumuleaza $%,91> din informatia totala.2dau'area unei noi componente ar mari acest procent la 89,:#>.
Ei7en-ales of the Co-ariance Matri/
Ei7en-ale ifference Pro,ortion Cmlati-e
8 3.01094821 1.43669959 0.4301 0.4301
9 1.57424862 0.31404618 0.2249 0.6550
1.26020244 0.41331133 0.1800 0.8351
+ 0.84689111 0.56796502 0.1210 0.9560
: 0.27892609 0.26094675 0.0398 0.9959
; 0.01797933 0.00717513 0.0026 0.9985
< 0.01080421 0.0015 1.0000
i'envectors reda coeficientii variabilelor ori'inale in ecuatiile liniare ale componentelor
principale. n acelasi timp, ea su'ereaza natura componentelor prin evidentierea puternicei corelatii
8
8/13/2019 Analiza Datelor Proiect Final
10/25
cu anumite variabile iniale. 2stfel, componenta 1 se afla in le'atura cu Cifra
8/13/2019 Analiza Datelor Proiect Final
11/25
Dupa al doilea punct de pe 'rafic ce simbolizeaza cea de-a doua componenta, panta sereduce si forma 'raficului se aplatizeaza.
raficul de mai jos reprezinta 'raficul primelor " componente principale si poate fi utilizat
pentru a determina anumite trenduri urmate de variabile. 0e remarca ca 0+P este in extrema dreapta
a 'raficului inre'istrand valori ridicate pentru cifra de afaceri si profitul net, in timp de D2 seafla in extrema stan'a cu valori mult mai reduse pentru cifra de afaceri si profitul net. 2dmitand ca
primele doua componente principale sunt dintr-o distributie normala, 'raficul su'ereaza ca punctele
de extrem (0+P, 6+, 4) ar putea fi eliminate din analiza.
11
8/13/2019 Analiza Datelor Proiect Final
12/25
Analiza factoriala
2naliza factoriala isi propune identificarea unor factori ascunsi, necuantificabili, care sa
explice variabilele considerate initial.ntr-o prima varianta, toate variabilele explicative sunt supuse testului de identificare a
factorilor comuni.
he #ACOR Procedrenitial +actor #et-o%: /rincipal +actors
Prior Commnalit= Estimates* SMC
Cifraafaceri Profitnet Rentabecon Lichiditate Nrsalariati PER EPS
0.97417168 0.97949979 0.55562171 0.37898420 0.98339848 0.28796072 0.41353694
Ei7en-ales of the Redced Correlation Matri/* otal 1 +.:
8/13/2019 Analiza Datelor Proiect Final
13/25
4 (actors ;ill be retaine% b< t-e #&')'& criterion.
Din tabelul ;Prior Communalit stimates? se evidentiaza 0MC (0Euared MultipleCorrelation) pentru fiecare variabila.
Din tabelul ;i'envalues of the educed Correlation Matrix? in care este explicata varianta
totala ni se su'ereaza ca doar & factori vor fi retinuti de criteriul M++.
eprezentarea 'rafica este redata mai jos*
nitial +actor #et-o%: /rincipal +actors
Scree Plot of Eigenvalues|
3.0 + 1|||||
2.5 +|||||
2.0 +||
E |i |g |e 1.5 +n |v |a |l |u | 2e 1.0 +
s ||||| 3
0.5 +||| 4||
0.0 + 5 6||| 7||
-0.5 +---------+---------+---------+---------+---------+---------+---------+---------+---------
0 1 2 3 4 5 6 7
Nu!er
1%
8/13/2019 Analiza Datelor Proiect Final
14/25
orma initiala a matricii factor este redata in tabelul ;actor Pattern?, iar varianta explicata
de fiecare din factori este redata in tabelul ;Variance xplained b ach actor?. 6abelul ;inal
Communalit stimates? exprima proportia variantei variabilelor retinute de factorii comuni.
#actor Pattern
#actor8 #actor9 #actor #actor+
Cifraafaceri Cifraafaceri 0.97791 0.12563 0.08414 0.06941
Profitnet Profitnet 0.99023 0.05942 0.03561 0.06637
Rentabecon Rentabecon 0.08173 0.79116 0.07485 0.12148
Lichiditate Lichiditate 0.13668 0.29927 0.59842 0.06439
Nrsalariati Nrsalariati 0.99220 0.04956 0.04011 0.00168
PER PER 0.12712 0.25272 0.44477 0.28780
EPS EPS 0.11168 0.51312 0.22501 0.34209
'ariance E/,lained b= Each #actor
#actor8 #actor9 #actor #actor+
2.9753215 1.0644344 0.6221209 0.2279856
#inal Commnalit= Estimates* otal 1 +.>>?>;
Cifraafaceri Profitnet Rentabecon Lichiditate Nrsalariati PER EPS
0.98399855 0.98976186 0.65297735 0.47049895 0.98851977 0.36068147 0.44342455
nitial +actor #et-o%: /rincipal Components/rior Communalit< 'stimates: &'
1&
8/13/2019 Analiza Datelor Proiect Final
15/25
Ei7en-ales of the Correlation Matri/* otal1 < A-era7e 1 8
Ei7en-ale ifference Pro,ortion Cmlati-e
8 3.01094821 1.43669959 0.4301 0.4301
9 1.57424862 0.31404618 0.2249 0.6550
1.26020244 0.41331133 0.1800 0.8351
+ 0.84689111 0.56796502 0.1210 0.9560
: 0.27892609 0.26094675 0.0398 0.9959
; 0.01797933 0.00717513 0.0026 0.9985
< 0.01080421 0.0015 1.0000
2 (actors ;ill be retaine% b< t-e &+AC! criterion.
Doar " factori vor fi retinuti de analiza factoriala.
#actor Pattern
#actor8 #actor9
Cifraafaceri Cifraafaceri 0.97608 0.14057
Profitnet Profitnet 0.99006 0.01414
Rentabecon Rentabecon 0.10622 0.90892
Lichiditate Lichiditate 0.18028 0.37277
Nrsalariati Nrsalariati 0.98920 0.07600
PER PER 0.18111 0.37948
19
8/13/2019 Analiza Datelor Proiect Final
16/25
#actor Pattern
#actor8 #actor9
EPS EPS 0.15133 0.66289
'ariance E/,lained b= Each#actor
#actor8 #actor9
3.0109482 1.5742486
#inal Commnalit= Estimates* otal 1 +.:>:8? CL A! 3 0.0003 .999 . . 218 3.1
9< CL8 APC 3 0.0003 .999 . . 206 2.0
9; CL5 MPN 4 0.0004 .998 . . 183 2.9
9: ENP ME# 2 0.0005 .998 . . 168 .
9+ CL9? #LA 3 0.0005 .997 . . 158 2.2
9 SNO RP 2 0.0006 .997 . . 151 .
99 CL9> IMP 4 0.0007 .996 . . 143 3.9
98 CL9< &CM 4 0.0007 .995 . . 137 3.5
95 !CM CL9 3 0.0008 .994 . . 133 1.4
8? CL98 CL9: 6 0.0010 .994 . . 128 2.4
8> A"O SR 2 0.0013 .992 . . 120 .
8< CL9+ OIL 4 0.0016 .991 . . 113 4.2
8; ALR COS 2 0.0022 .988 . . 103 .
8: CL9; CL8? 10 0.0024 .986 . . 96.1 5.7
8+ CL99 CL8> 6 0.0025 .984 . . 92.1 4.3
8 CL95 E 4 0.0025 .981 . . 90.6 3.7
89 CL8: EL 11 0.0044 .977 . . 83.8 6.8
88 PPL SOCP 2 0.0055 .971 . . 77.6 .
85 CL8+ CL89 17 0.0087 .963 . . 68.5 8.7
? CL8; CL8 6 0.0094 .953 . . 63.5 6.2
"#
8/13/2019 Analiza Datelor Proiect Final
21/25
Clster 4istor=
NCL Clsters oined #RED SPRSD RSD ERSD CCC PS# PS9 ie
> CL85 CL8< 21 0.0137 .939 . . 57.6 10.0
< CL? COR 7 0.0162 .923 . . 54.1 5.2
; CL88 E#O 3 0.0251 .898 .714 12.7 49.4 4.6
: CL> CL< 28 0.0520 .846 .667 10.3 39.9 19.0
+ CL; S" 4 0.1206 .725 .604 4.78 26.4 7.9
CL: $N 29 0.1551 .570 .507 1.82 20.6 33.9
9 CL CL+ 33 0.1697 .401 .355 1.04 21.4 12.2
8 CL9 SNP 34 0.4007 .000 .000 0.00 . 21.4
raficul urmator prezinta trei statistici pentru estimarea numarului de clustere. Varfurile
'raficului CCC cu valori mai mari decat " sau % indica clustere bune. Valorile intre # si " indicaposibile clustere.
4 alta metoda de stabilire a numarului de clustere este prin statistica pseudo . Valorile
relativ mari indica un numar bun de clustere.
"1
8/13/2019 Analiza Datelor Proiect Final
22/25
Dendo'rama este 'raficul care evidentiaza structura clusterelor, componenta lor si etapele
de a're'are in urma carora au fost obtinute. 2ceasta ne poate ajuta sa decidem asupra numaruluioptim de clase ce trebuie retinute in analiza, prin aparitia unor 'ap-uri.
""
8/13/2019 Analiza Datelor Proiect Final
23/25
3n astfel de 'ap este evidentiat si in 'raficul urmator prin linia rosie* ea intersecteaza
dendo'rama in : puncte, ceea ce ne su'ereaza formarea a sase clustere.
"%
8/13/2019 Analiza Datelor Proiect Final
24/25
"&
8/13/2019 Analiza Datelor Proiect Final
25/25
irmele din cele : 'rupe sunt*
rupa 1 * 0+P
rupa " * 06I
rupa % * 4, 04CP, PP=
rupa & * 6+
rupa 9 * C46, 63, 6P, 0+4, BCM, C40, 2=
rupa : * 4=, =2, CMP, CM, 6=, M, +P, 3CM, 2PC, D2, CC,
MP+, V+C, BM, 2M4, 06, 2I4, MP, 26B, C4M, 20
top related