PENGANTAR RJuli, 2012
SChambers, Becker, Wilks
1984: Bell Labs
SChambers, Becker, Wilks
1984: Bell Labs
S-Plus1988: Statistical Sciences
1993: MathSoft2001: Insightful2008: TIBCO
S-Plus1988: Statistical Sciences
1993: MathSoft2001: Insightful2008: TIBCO
RIhaka & Gentleman
1996(The R Project)
RIhaka & Gentleman
1996(The R Project)
Why R?• Free
• Open source• Many packages
• Large support base
• Multi-platform
PENGANTAR RJuli, 2012
R E
V I E
W
POPULASI adalah seluruh obyek yang mungkin terpilih atau keseluruhan ciri yang dipelajari. Ukuran populasi dapat terhingga (countable) atau tak terhingga (uncountable).
Sampel adalah sebagian dari populasi. Artinya tidak akan ada sampel jika tidak ada populasi.
POPULASI
SAMPEL
sam
plin
g
infe
ren
si
Nilai sebenarnya dari sifat populasi disebut dengan parameter populasi, yang biasanya dilambangkan dengan huruf Yunani seperti (mu), (sigma), (pi), (rho), dan (theta).
PENGANTAR RJuli, 2012
D A T A = DATASETKumpulan nilai yang diperoleh dari hasil pengukuran atau penghitungan suatu variabel.
Ob
jek
varia
te/n
ilai
VARIABEL
Sebagai konsep, kualitas, karakteristik, atribut, atau sifat-sifat dari suatu objek (orang, benda, tempat, dll) yang nilainya berbeda-beda antara satu objek dengan objek lainnya dan sudah ditetapkan oleh peneliti untuk dipelajari dan ditarik kesimpulannya
Variabel
R E
V I E
W
Observasi = Percobaan (eksperiment) dimaknai sebagai proses membangkitkan sekumpulan data atau tiap proses yang menghasilkan data mentah.
PENGANTAR RNOTASI PENCATATAN DATA
Ob
jek
varia
te/n
ilai
Variabel
R E
V I E
W
Statistika bermanfaat untuk mempelajari populasi, menganalisis populasi.
Dalam mempelajari populasi, kita memfokuskan pada satu atau lebih karakteristik dari unit-unit populasi. Karakteristik ini dinamakan VARIABEL.
Contoh : Kita mungkin tertarik dengan variabel umur, konsumsi pulsa, penghasilan, tingkat pendidikan dsb.
Karena keterbatasan waktu dan biaya untuk meneliti suatu populasi, umumnya diambil sejumlah sampel.
Hasil pengukuran variabel terhadap objek-objek pengamatan (anggota sampel / populasi) dinamakan data atau dataset.(jamak dari datum atau variate atau nilai).
PENGANTAR RNOTASI PENCATATAN DATA
R E
V I E
W
resp Sex Umur Jml Anak Berat Badan Tinggi Badan
1 0 57 1 65 158
2 1 70 3 100 175
3 0 45 0 71 162
4 0 38 2 58 164
5 0 25 1 81 170
...
n 1 1 4 85 172
PENGANTAR RNOTASI PENCATATAN DATA
A = (0 57 1 65 1551 70 3 100 1750 45 0 71 100 53 2 55 1640 25 1 51 179... ... ... ... ...1 1 4 55 172
)Masing-masing baris merepresentasikan satu pengamatan = RecordNilai-nalia hasil pengematan terhadap anggota sampel (Individu) dicatat dalam satu baris.
Setiap KOLOM merepresentasikan nilai satu VARIABEL = Field
PENGANTAR RNOTASI PENCATATAN DATA
Variabel 1 Variabel 2 ... Variabel k ... Variabel p
Item 1 x11
x12
... x1k
... x1p
Item 2 x21
x22
... x2k
... x2p
......
......
......
Item j xj1
xj2
... xjk
... xjp
......
......
......
Item n xn1
xn2
... xnk
... xnp
PENGANTAR RNOTASI PENCATATAN DATA
A = (x11 x 12 ... x1k ... x 1p
x 21 x 22 ... x 2k ... x 2p
... ... ... ... ... ...x j1 x j2 ... x jk ... x jp... ... ... ... ... ...x n1 x n2 ... x nk ... x np
)X̄ k = 1
n ∑j=1
n
x jk s12 1n∑j=1
n
(x j1− X̄ 1)2 sk
2 1n∑j=1
n
( x jk − X̄ k)2 dimana k=1,2,. .. , p
PENGANTAR RNOTASI PENCATATAN DATA
Contoh : Observasi dilakukan terhadap Toko Buku Gramedikau untuk melihat hubungan antara harga buku dengan banyaknya buku yang terjual. Pengamatan diperoleh sebagai berikut :
Penjualan Harga Buku
5 80
12 40
8 60
2 110
Tuliskan hasil pengamatan tersebut dalam matriks !
A = ( 5 8012 408 602 110
)
PENGANTAR RManajemen Data
DATA OBJEKOBJEK
Type Data
Mode Data
Vektor Matriks List
Data Frame Array Factor
Function
Numerik Komplex
Logical Character
PENGANTAR RManajemen Data
Mode Contoh di console
Numerik >23>c(23,14,15,16)>data.bulan<-c(1,2,3,4,5,6,7,8,9,10,11,12)
Complex >2+5i>sqrt(as.complec(-5))
Logical >c(T,F,F,T,F,T,F,F)>data.tahun > 1967
Character >c(“Amir”,”Muis”,”oke”)>c(“F”,”T”,”F”,”34”)
c() adalah fungsi untuk membuat vektor.
<- adalah tanda asignment untuk memberi nama suatu objek
PENGANTAR RManajemen Data
Nama Objek “Case Sensitive” – membedakan huruf besar dan huruf kecil.
Nama Objek harus dimulai dengan HURUF dan ditambah dengan kombinasi dari huruf besar, angka, huruf kecil dan titik.
dataqxydataku.12.juli
1dataqx-yDataku=12.juli
Assignment atau pemberian nama suatu objek digunakan operator “<-” atau “=”
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> 4+6[1] 10
R melakukan penghitungan skalar aritmetik yang menhasilkan nilai skalar 10. Oleh R dianggap sebagai vektor dengan panjang 1[1] menunjukkan elemen pertama dari vektor
Vektor merupakan suatu array atau himpunan bilangan, character atau string, logikal value dan merupakan objek yang paling dasar dalam R.
Pada data vektor harus digunakan mode tunggal, sehingga gabungan dua data atau lebih yang berbeda mode tidak dapat dilakukan ke dalam satu objek vektor.
Jika ini dilakukan maka R akan mengubah data ke dalam mode yang lebih umum.
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> c(T,1:10) [1] 1 1 2 3 4 5 6 7 8 9 10
> c("F",F,T)[1] "F" "FALSE" "TRUE"
> c("A",2,4,F,T)[1] "A" "2" "4" "FALSE" "TRUE"
c() adalah fungsi untuk membuat vektor. Bisa dikatakan sebagai combine
PENGANTAR R
PENGANTAR RPemberian NAMA OBJEK
=== Assignment >x<-12 .6
>x
[1] 12.6
>s<-”a adalah string” >s
[1] "a adalah string"
>t<-TRUE>t
[1] TRUE
>t<-true Error: object 'true' not found
PENGANTAR R
PENGANTAR RPemberian NAMA OBJEK
=== Assignment VARIABEL
PENGANTAR R
=== Assignment
>x<letters 1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" "r" "s"[20] "t" "u" "v" "w" "x" "y" "z"
>length(lettters) > length(letters)[1] 26
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> 6[1] 6
> x<-6> x[1] 6
> y<-4> z<x+yError: object 'z' not found
> z<-x+y> z[1] 10
> ls()[1] "x" "y" "z"
Fungsi ls() untuk me list objek yang telah dibuat
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> z<-c(5,9,1,0)> z[1] 5 9 1 0
Fungsi c() untuk membuat vektor atau meng combine vector.
> x<-c(5,9)> y<-c(1,0)> z<-c(x,y)> z[1] 5 9 1 0
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> x<-c(10,5,3,6)> x[1] 10 5 3 6> y<-c(x,0.555,x,x)
> y [1] 10.000 5.000 3.000 6.000 0.555 10.000 5.000 3.000 6.000 10.000[11] 5.000 3.000 6.000
> round(y,1) [1] 10.0 5.0 3.0 6.0 0.6 10.0 5.0 3.0 6.0 10.0 5.0 3.0 6.0
> z<-x*x> z[1] 100 25 9 36
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> b<-c(10,5,14,12,8,11,9,10,16,20)> b [1] 10 5 14 12 8 11 9 10 16 20
> b[2][1] 5
> b[c(1,3,5)][1] 10 14 8
> b[-c(1,10)][1] 5 14 12 8 11 9 10 16
> b[b>10][1] 14 12 11 16 20
> r<-b[b>10]> r[1] 14 12 11 16 20
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> x<-1:10> x [1] 1 2 3 4 5 6 7 8 9 10
Fungsi seq() untuk membuat vektor dengan nilai yang berurutan
> seq(1,9,by=2)[1] 1 3 5 7 9
> seq(8,20,length=6)[1] 8.0 10.4 12.8 15.2 17.6 20.0
> rep(1:4,4) [1] 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
> rep(1:4,rep(4,4)) [1] 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4
Fungsi rep() untuk membuat vektor dengan nilai pengulangan
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> rep(0,100) [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 [38] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 [75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
> rep(1:3,6) [1] 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3
> rep(1:3,c(6,4,2)) [1] 1 1 1 1 1 1 2 2 2 2 3 3
PENGANTAR RJenis Jenis Data Objek === VEKTOR
> x<-c(6,8,9)> y<-c(1,2,4)
> z<-x*y> t<-x+y
> x+2[1] 8 10 11
> z[1] 6 16 36
> t[1] 7 10 13
> x<-c(10,5,3,6)
> length(x)[1] 4
> sum(x)[1] 24
> prod(x)[1] 900
> max(x)[1] 10
> min(x)[1] 3
PENGANTAR RManipulasi Data
Diberikan data observasi tinggi badan Mahasiswa Informatika 49 sbb : 155, 160, 171, 182, 162, 153, 190, 167, 168, 165, 191
> tinggi.mahasiswa<-c(155,160,171,182,162,153,190,167,168,165,191)
> sort(tinggi.mahasiswa) [1] 153 155 160 162 165 167 168 171 182 190 191
> median(tinggi.mahasiswa)[1] 167
> mean(tinggi.mahasiswa)[1] 169.4545
> round(mean(tinggi.mahasiswa),1)[1] 169.5
> var(tinggi.mahasiswa)[1] 169.8727
> sd(tinggi.mahasiswa)[1] 13.03352
> quantile(tinggi.mahasiswa,0.25)25% 161
> quantile(tinggi.mahasiswa,0.50)50% 167
> quantile(tinggi.mahasiswa,0.75) 75% 176.5
PENGANTAR RManipulasi Data
> datas<-c(1,3,5,2,9)> mean(datas)[1] 4
> datas<-c(1,3,5,2,9,0,7,10)> mean(datas)[1] 4.625
> datas<-c(1,3,5,2,9,NA,7,10)> mean(datas)[1] NA
> mean(datas,na.rm=T)[1] 5.285714
PENGANTAR RMatriks dan Array
> x<-1:8> dim(x)<-c(2,4)> x [,1] [,2] [,3] [,4][1,] 1 3 5 7[2,] 2 4 6 8
> x<-matrix(1:8,2,4,byrow=F)> x [,1] [,2] [,3] [,4][1,] 1 3 5 7[2,] 2 4 6 8
> x<-matrix(1:8,2,4,byrow=T)> x [,1] [,2] [,3] [,4][1,] 1 2 3 4[2,] 5 6 7 8
PENGANTAR RMatriks dan Array
> cbind(c(1,2),c(3,4)) [,1] [,2][1,] 1 3[2,] 2 4
> x<-c(5,7,9)> y<-c(6,3,4)> z<-cbind(x,y)> z x y[1,] 5 6[2,] 7 3[3,] 9 4
> dim(z)[1] 3 2
> d<-rbind(x,y)> d [,1] [,2] [,3]x 5 7 9y 6 3 4
> dim(d)[1] 2 3
> rbind(z,z) x y[1,] 5 6[2,] 7 3[3,] 9 4[4,] 5 6[5,] 7 3[6,] 9 4
> cbind(z,z) x y x y[1,] 5 6 5 6[2,] 7 3 7 3[3,] 9 4 9 4
PENGANTAR RMatriks dan Array
> z<-c(5,7,9,6,3,4)> z1<-matrix(z,nrow=3)> z1 [,1] [,2][1,] 5 6[2,] 7 3[3,] 9 4
> z2<-matrix(z,ncol=3)> z2 [,1] [,2] [,3][1,] 5 9 3[2,] 7 6 4
> z3<-matrix(z,ncol=2)> z3 [,1] [,2][1,] 5 6[2,] 7 3[3,] 9 4