Tugas Final Probabilitas dan Statistika “R-Graph” Disusun Oleh : Nama : Sherly N. Thahir (11013102) Mariane K. Toar (11013045) JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK 2 0 1 2 UNIVERSITAS KATOLIK DE LA SALLE MANADO
Tugas Final Probabilitas
dan Statistika
“R-Graph”
Disusun Oleh :
Nama : Sherly N. Thahir
(11013102)
Mariane K. Toar
(11013045)
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
2
0
1
2
UNIVERSITAS KATOLIK DE LA SALLE
MANADO
R-GRAPH – Probabilitas Dan Statistika
i
DAFTAR ISI
DAFTAR ISI .................................................................... i
BAB I – LANDASAN TEORI ........................................... 1
BAB II – PEMBAHASAN ................................................ 3
BAB II.1 – GRAFIK MENGGUNAKAN
R‐Commander………………………………. 9
BAB III – CODING ........................................................ 27
REFERENSI .................................................................... ii
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 1 | 61
BAB I
LANDASAN TEORI
Grafik sering juga disebut sebagai diagram, bagan, maupun
chart. Pada dasarnya grafik berfungsi memberikan penjelasan kepada
para pembaca grafik atau orang yang membutuhkan data. Grafik itu
sendiri bisa memudahkan pembaca untuk mengetahui dan membaca
data tanpa menggunakan kata - kata yang bertele-tele karena grafik
menyajikan data dalam bentuk angka dalam sebuah lembar kerja dalam
bentuk visualisasi grafik.
Berikut ini adalah pengertian dan definisi grafik:
# NANI DARMAYANTI
Grafik adalah gambaran pasang surut suatu keadaan yang dilukiskan
dengan garis atau gambar.
# KARL E. CASE
Grafik adalah penyajian dua dimensi dari suatu kelompok angka atau data
# MURRAY R. SPIEGEL & LARRY J. STEPHENS
Grafik merupakan tampilan gambar dari hubungan di antara variabel -
variabel
# I WAYAN NUARSA
Grafik merupakan penyajian data dalam bentuk gambar atau simbol
# SOEDARSO
Grafik merupakan bentuk penyajian visual yang dipakai untuk
membandingkan jumlah data pada saat - saat yang berbeda
# YUDHY WICAKSONO
Grafik merupakan salah satu model penyajian data dalam bentuk visual
yang banyak digunakan di berbagai bidang profesi
# HERY SONAWAN
Grafik merupakan penggambaran data - data yang di plot dalam sebuah
bidang yang menghubungkan dua variabel atau lebih
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 2 | 61
# LILIS ROHAENI & FIKRURRAHMAN
Grafik merupakan sebuah gambar yang terdiri atas garis titik - titik koordinat
# J. SUPRANTO
Grafik merupakan gambar - gambar yang menunjukkan secara visual data
berupa angka (mungkin juga dengan simbol - simbol) yang biasanya juga
berasal dari tabel - tabel yang telah dibuat
# MURRAY
Grafik adalah representasi gambar dari hubungan yang terdapat di antara
variabel - variabel
# KATHLEEN MEEHAN ARIAS
Grafik adalah sebuah metode yang digunakan untuk menyajikan data
kuantitatif secara visual
Dalam pembahasan kali ini akan dibahas beberapa macam grafik dan
menggunakan R-program untuk mempermudah pembuatan grafik
tersebut.
Bahasa R merupakan versi sumber terbuka (open-source) dari
bahasa pemrograman S (Azola dan Harrel, 2006). Versi komersial yang
berbasis bahasa S adalah S plus. Bahasa R memiliki kemampuan yang tidak
kalah dangan paket-paket program pengolahan data komersial bahkan
dalam beberapa hal kemampuannya lebih baik. Perbandingan R
khususnya terhadap SAS dibahas secara rinci oleh Azola dan Harrel (2006).
Bahasa R mendapat sambutan yang baik dari kalangan statistikawan di
seluruh dunia, sayangnya di Indonesia belum banyak dikenal. Tulisan ini
dibuat untuk mengenalkan bahasa R khsusunya kalangan akademisi di
Indonesia, dan untuk mendukung gerakan IGOS (Indonesia Go Open
Source).
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 3 | 61
BAB II
PEMBAHASAN
Penjelasan mengenai beberapa jenis grafik/diagram :
Histogram
Dalam ilmu statistik, histogram adalah sebuah representasi grafik yang
menampilkan impresi visual dari distribusi data. Histogram adalah sebuah
estimasi distribusi probabilitas dari variabel kontinyu dan pertama kali
diperkenalkan oleh seorang ahli bernama Karl Pearson. Histogram terdiri dari
frekuensi tabular, ditunjukan sebagai balok yang berdekatan, didirikan
sepanjang interval yang berlainan, dengan luas yang sama dengan
frekuensi dari observasi di dalam interval. Tinggi dari balok juga sama
dengan densitas frekuensi dari intervalyaitu frekuensi yang dibagi oleh lebar
dari interval. Keseluruhan luas atau area dari histogram sama dengan
jumlah data yang ada. histogram juga dapat dinormalisasi dalam
menampilkan frekuensi relative. Hal ini kemudian menunjukkan proporsi dari
beberapa case yang jatuh pada masing-msaing kategori, dengan luas
total yang sama dengan 1. Kategori-kategori ini biasanya dispesifikasi
secara berurutan, tidak ada overlapping interval pada setiap variabel.
Kategori (interval) harus terletak secara berdampingan, dan sering kali
dipilih dalam bentuk yang memiliki ukuran yang sama.
Kata histogram berasal dari bahasa Yunani: histos, dan gramma. Pertama
kali digunakan oleh Karl Pearson pada tahun 1895 untuk memetakan
distribusi frekuensi dengan luasan area grafis batangan menunjukkan
proporsi banyak frekuensi yang terjadi pada tiap kategori.[2] dan
merupakan salah satu dari 7 basic tools of quality control yaitu Diagram
Pareto (Pareto chart), check sheet, diagram kontrol (control chart), Diagram
ishikawa (cause-and-effect diagram), Diagram alir (flowchart), dan scatter
diagram. Laman lain yang menjelaskan konsep histogram termasuk
konstruksi, model diagram dan perubahannya.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 4 | 61
Diagram garis
Ada kalanya data dicatat pada waktu-waktu tertentu secara berurutan.
Dengan menempatkan waktu pada sumbu horizontal dan nilai-nilai data
dicatat pada sumbu vertikal akan diperoleh titik-titik. Jika titik-titik tersebut
dihubungkan oleh garis lurus maka terbentuklah suatu diagram garis seperti
di bawah ini.
Salah satu kelebihan dari diagram garis, perubahan lulusan dari tahun ke
tahun mudah dilihat. Dengan diagram jenis ini, kita juga dapat mengetahui
kecenderungan data yang kita amati. Kemudian kita dapat
memperkirakan waktu selanjutnya, tentunya dengan hati-hati. Ada dua
istilah mengenai perkiraan data menggunakan diagram garis, yaitu:
1. Interpolasi adalah membuat perkiraan nilai data di antara waktu
berurutan yang diketahui. Misalnya kita kehilangan data mengenai
banyaknya lulusan SMA jaya Selalu tahun 2004. Kita bisa
memperkirakan data melalui data tahun 2003 dan 2005.
2. Ekstrapolasi adalah membuat perkiraan nilai data untuk waktu yang
akan datang (di luar waktu-waktu yang diketahui). Misalnya kita
memperkirakan banyaknya lulusan tahun 2008 dengan
menggunakan data tahun 2005 dan 2006. Biasanya kita melakukan
ekstrapolasi dengan memperpanjang diagram tersebut.
Diagram batang
Diagram batang menggunakan persegi panjang (batang) untuk
menyatakan banyaknya data pada kategori tertentu (bisa waktu, tempat,
dan lain-lain). Banyaknya data dinyatakan sebagai tinggi batang
sedangkan lebar dari tiap batang dibuat sama. Letak batang disusun
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 5 | 61
berjajar dan diberi jarak antar batang. Untuk lebih jelasnya lihat contoh
berikut:
Diagram lingkaran
Diagram lingkaran adalah diagram yang digunakan untuk menunjukkan
perbandingan (rasio) nilai data tertentu terhadap semua data.
Diagram lingkaran disajikan dengan membagi lingkaran menjadi beberapa
sektor atau juring. Banyaknya sector tergantung dari banyaknya data.
Setiap sector menunjukkan satu datum atau satu jenis data. Besar sector
merupakan prosentase dari nilai datum terhadap keseluruhan nilai data.
Untuk lebih jelasnya silahkan lihat contoh berikut ini:
Gambarkan diagram lingkaran yang menyatakan jumlah siswa yang
bersekolah di SD, SMP, dan SMA dalam Sekolah Jaya Selalu. Diketahui
banyaknya siswa SD 750, siswa SMP 450, siswa SMA 600.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 6 | 61
Diagram kotak-garis
Diagram kotak-garis atau (box-plot) merupakan suatu diagram yang
menggambarkan letak statistika lima serangkai (ukuran terbesar, ukuran
terkecil, media, kuartil atas, kuaartil bawah) dalam bentuk kotak yang
berekor. Untuk lebih jelasnya dapat dilihat pada diagram di bawah ini.
Untuk membuat diagram kotak-garis, kita haya perlu mencari statistika lima
serangkai dari data dan kemudian menempatkannya sesuai dengan
contoh diagram di atas.
Diagram batang-daun
Diagram batang-daun terdiri atas batang-batang dan setiap btang terdiri
dari beberapa daun. Diagram ini dapat digunakan untuk melihat seberapa
jauh nilai median terhadap statistik ekstrim (Xmin atau Xmaks).
Untuk membuat diagram batang-daun, pertama data diurutkan terlebih
dahulu dari kecil ke besar. Kemudian data dibagi atas selang-selang dan
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 7 | 61
satu selang dinyatakan sebagai satu batang. Datum yang masuk ke dalam
suatu selang merupakan daun dari selang/batang tersebut.
Contohnya jika kita memiliki data 7, 8, 10, 10, 14, 16, 18, 18, 19, 20, 21, 22, 27,
29, 30; diagram batang-daunnya ialah sebagai berikut
Quantile-Quantile Plots
qqnorm adalah fungsi generik metode standar yang menghasilkan plot QQ
normal dari nilai-nilai di y. qqline menambahkan baris ke plot kuantil-kuantil
normal yang melewati kuartil pertama dan ketiga.
qqplot menghasilkan plot QQ dua dataset.
Parameter grafis dapat diberikan sebagai argumen untuk qqnorm, qqplot
dan qqline.
Generic X-Y Plotting
Fungsi umum untuk memplot objek R.
Scatterplots
Sebuah scatter plot atau scattergraph adalah jenis diagram matematika
menggunakan koordinat Cartesian untuk menampilkan nilai-nilai untuk dua
variabel untuk satu set data.
Data ditampilkan sebagai koleksi poin, masing-masing memiliki nilai dari satu
variabel menentukan posisi pada sumbu horisontal dan nilai dari variabel
lain yang menentukan posisi pada sumbu vertikal. Ini semacam plot juga
disebut grafik scatter, scattergram, scatter diagram atau grafik pencar.
Index Plot
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 8 | 61
Plot indeks nilai data adalah plot setiap nilai (Y) terhadap tatanan dalam
kumpulan data (X). Jika data yang dimasukkan ke dalam tabel dalam
urutan di mana mereka dikumpulkan, misalnya, maka plot nilai data
terhadap nomor baris akan menghasilkan plot indeks.
Stripchart
Stripchart memproduksi satu dimensi scatter plot (atau plot dot) dari data
yang diberikan. Plot ini merupakan alternatif yang baik untuk boxplots ketika
ukuran sampel kecil.
Dot Plot
Sebuah grafik dot atau dot plot adalah grafik statistik yang terdiri dari titik
data diplot pada skala yang sederhana, biasanya dengan mengisi
lingkaran. Ada dua umum, namun sangat berbeda, versi dari grafik dot.
Yang pertama digambarkan oleh Wilkinson sebagai grafik yang telah
digunakan di tangan-digambar (pre-komputer era) grafik untuk
menggambarkan distribusi. Versi lain digambarkan oleh Cleveland sebagai
alternatif untuk grafik batang, di mana titik-titik yang digunakan untuk
menggambarkan nilai-nilai kuantitatif (misalnya jumlah) yang berhubungan
dengan variabel kategori.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 9 | 61
BAB II.1
GRAFIK MENGGUNAKAN R‐Commander
Pada bab ini akan dibahas penggunaan R‐Commander
untuk membuat penyajian statistik deskriptif dari suatu kumpulan data.
Fokus utama adalah pembuatan beberapa macam bentuk grafik yang
banyak digunakan dalam analisis data.
Sebagai langkah awal, buka kembali program R dengan
mengklik icon R 2.6.1. Kemudian, ubah direktori dimana file workspace
berada. Misalkan file latihan4.RData (hasil impor data SPSS dengan
nama file WORLD95.SAV) ada di ‘C:\Kerja_R’, maka direktori diubah ke
C:\Kerja_R. Load file workspace tersebut dengan menggunakan menu
File, pilih Load Workspace… seperti pada gambar berikut ini.
Gambar 4.1. Jendela dialog untuk Load Workspace
Setelah diklik Load Workspace… maka jendela R akan memberikan pilihan
direktori dan file workspace mana yang akan ditampilkan, seperti yang
terlihat pada Gambar 4.2. Pilihlah file workspace latihan4.RData yang ada
di direktori C:\Kerja_R.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 10 | 61
Gambar 4.2. Jendela dialog untuk pilihan file workspace yang akan
diaktifkan
Langkah selanjutnya adalah mengaktifkan R‐commander
dengan menggunakan perintah library(Rcmdr). Setelah itu, aktifkan
dataset dengan menggunakan menu Data, klik Dataset aktif, dan Pilih
dataset aktif… seperti yang ditampilkan pada Gambar 4.3.
Gambar 4.3. Jendela dialog untuk memilih dataset yang akan diaktifkan
Dari beberapa pilihan Datasets yang ada, klik latihan4 sebagai file
workspace yang akan diaktifkan, seperti pada Gambar 4.4. Dengan
demikian, proses pengaktifan kembali data latihan4 sudah dilakukan, dan
proses analisis data baik secara statistik deskriptif atau inferens dapat
dilakukan.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 11 | 61
Gambar 4.4. Jendela dialog untuk pilihan dataset yang akan diaktifkan
II.1.1. Grafik dalam R‐GUI
R menyediakan banyak menu pilihan grafik pada R‐Commander,
antara lain Histogram, Diagram Batang dan Daun, Boxplot, dan lain‐lain.
Secara lengkap pilihan grafik yang tersedia dapat dilihat pada gambar
berikut ini.
Gambar 4.5. Jendela dialog untuk pilihan Grafik pada R‐Commander
II.1.2. Grafik Histogram
Menu yang digunakan untuk membuat grafik histogram adalah
Grafik, pilih Histogram… . Misalkan akan dibuat histogram untuk variabel
LIFEEXPF (usia harapan hidup wanita di suatu negara), maka pada jendela
dialog yang muncul, pilih LIFEEXPF seperti pada Gambar 4.6. Isikan jumlah
interval yang diinginkan pada kolom Banyaknya bin, dan klik OK untuk
menampilkan output histogramnya.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 12 | 61
Gambar 4.5. Jendela dialog pilihan variabel untuk pembuatan histogram
Output histogram untuk data LIFEEXPF yang diperoleh dari perintah di atas
dapat dilihat pada Gambar 4.6. Dalam contoh ini, digunakan metode
auto untuk pemilihan jumlah interval, yaitu metode Sturges dan Cacahan
Frekuensi yang digunakan untuk nilai (Skala Sumbu) yang diplotkan pada
histogram. Selain itu dapat digunakan pilihan Persentase atau Kepadatan
pada Skala Sumbu.
Output histogram ini dapat disimpan dengan menggunakan
menu File, dan pilih Save as dari jendela grafik. Pilihlah output yang sesuai,
misalkan saja dalam format PDF. Maka pilih format PDF dalam daftar
format file output. Selanjutnya, beri nama file output dengan
histogramLIFEEXPF.PDF. Selain itu, output histogram ini dapat pula disimpan
dalam format Metafile, Postcript, Png, Bmp, dan Jpeg.
Jika file histogram ini ingin dikopi untuk di insert kedalam program
lain, misalkan kedalam Microsoft Word, maka dapat digunakan menu File,
pilih Copy to the clipboard, dan pilih as a Bitmap atau Ctrl‐C. Kemudian,
buka program Microsoft Word, maka file grafik dapat di paste kan
menggunakan perintah Ctrl‐V.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 13 | 61
Gambar 4.6. Output histogram pada variabel LIFESXPF
Selain menggunakan menu di R‐Commander, pembuatan
histogram dapat juga dilakukan dengan command line di R‐
Console, yaitu dengan command hist diikuti argumen optional yang
diinginkan. Berikut adalah contoh pembuatan histogram dengan
command line untuk variabel LIFEEXPF dan LIFEEXPM (usia harapan
hidup pria di suatu negara).
> Hist(latihan4$LIFEEXPF, scale="frequency", breaks="Sturges",
col="darkgray") > Hist(latihan4$LIFEEXPF, scale="frequency", breaks=10, col="darkgray") > hist(latihan4$LIFEEXPF) > # lihat perbedaan output histogram yang dihasilkan > Hist(latihan4$LIFEEXPM, scale="frequency", breaks="Sturges",
col="darkgray")
> Hist(latihan4$LIFEEXPM, scale="frequency", breaks=10, col="darkgray")
> hist(latihan4$LIFEEXPM
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 14 | 61
II.1.3. Diagram Batang dan Daun (Stem‐and‐Leaf)
Menu yang digunakan untuk membuat diagram batang dan
daun adalah Grafik, pilih Sajian Batang dan Daun… . Misalkan akan dibuat
diagram batang dan daun untuk variabel LIFEEXPF, maka pada jendela
dialog yang muncul, pilih LIFEEXPF seperti pada Gambar 4.7.
Gambar 4.7. Jendela dialog untuk pembuatan diagram batang dan daun
Isikan argumen optional yang diinginkan pada kolom‐kolom yang tersedia,
dan klik OK untuk menampilkan output diagram batang dan daun. Output
dari diagram ini akan ditampilkan di Jendela Keluaran pada R‐Commander
seperti pada Gambar 4.8.
Output tersebut menjelaskan bahwa bilangan pada daun menunjukkan
nilai‐nilai satuan. Sehingga dapat diinterpretasikan bahwa usia
harapan hidup wanita yang terendah adalah 43 tahun dan yang
tertinggi adalah 82 tahun. Ada 3 (tiga) negara dengan usia harapan
hidup wanitanya sebesar 82 tahun. Dalam contoh ini, pilihan Automatik
menghasilkan diagram batang dan daun dengan jumlah kelas dalam
setiap batang adalah 5 kelas interval.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 15 | 61
> stem.leaf(latihan4$LIFEEXPF)
1 | 2: represents 12 leaf unit: 1
n: 109
LO: 43 44 44 45 45 46 47
9 5* | 00
12 t | 223
15 f | 455
17 s | 77
22 5. | 88889
6* |
23 t | 3
26 f | 455
32 s | 677777
39 6. | 8888899
45 7* | 000001
51 t | 222333
(14) f | 44444555555555
44 s | 66666777777888888888
24 7. | 9999999
17 8* | 00000001111111
3 t | 222
Gambar 4.8. Output diagram batang dan daun pada variabel LIFESXPF
Pembuatan diagram batang dan daun ini dapat juga dilakukan
dengan command line di R‐Console, yaitu dengan command stem.leaf
diikuti argumen optional yang diinginkan. Berikut adalah contoh
pembuatan diagram batang dan daun dengan command line untuk
variabel LIFEEXPF dan LIFEEXPM.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 16 | 61
> stem.leaf(latihan4$LIFEEXPF)
> stem.leaf(latihan4$LIFEEXPF, m=2)
> stem.leaf(latihan4$LIFEEXPF, style="bare", unit=1)
> # lihat perbedaan output diagram batang dan daun yang dihasilkan
> stem.leaf(latihan4$LIFEEXPM)
> stem.leaf(latihan4$LIFEEXPM, m=3)
> stem.leaf(latihan4$LIFEEXPF, style="bare", unit=1)
II.1.4. Grafik BoxPlot
R menyediakan pilihan Boxplot… pada menu Grafik untuk
membuat tampilan BoxPlot dari suatu data. Misalkan akan dibuat
BoxPlot untuk variabel LIFEEXPF berdasarkan RELIGION (kelompok
agama mayoritas di negara tersebut), maka pada jendela dialog yang
muncul, pilih LIFEEXPF seperti pada Gambar 4.9.
Gambar 4.9. Jendela dialog untuk pilihan variabel dalam pembuatan
Setelah itu, pilih Plot dengan kelompok… sehingga diperoleh tampilan
jendela seperti pada Gambar 4.10. Klik RELIGION sebagai variabel
kelompok, dan kemudian klik OK.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 17 | 61
Gambar 4.10. Jendela dialog untuk pilihan variabel kelompok dalam
Boxplot
Output dari BoxPlot yang diperoleh akan ditampilkan di Jendela
Keluaran pada R‐Commander seperti pada Gambar 4.11. Output
tersebut menjelaskan bahwa usia harapan hidup wanita di negara
dengan mayoritas penduduknya beragama Jewish (Yahudi) dan
Protestan secara rata‐rata adalah paling tinggi dibanding lainnya.
Gambar 4.11. Output BoxPlot pada variabel LIFESXPF berdasarkan
RELIGION
Command line di R‐Console dapat juga digunakan untuk pembuatan
BoxPlot, yaitu dengan command boxplot diikuti argumen optional yang
diinginkan. Berikut adalah contoh pembuatan BoxPlot dengan command
line untuk variabel LIFEEXPF dan LIFEEXPM sendiri‐sendiri dan berdasarkan
variabel RELIGION.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 18 | 61
> boxplot(latihan4$LIFEEXPF)
> boxplot(latihan4$LIFEEXPM)
> boxplot(LIFEEXPF~RELIGION, ylab="LIFEEXPF", xlab="RELIGION",
data=latihan4)
> boxplot(latihan4$LIFEEXPF~latihan4$RELIGION)
> # lihat perbedaan output Box‐Plot yang dihasilkan
II.1.5. Grafik QQ‐Plot
QQ‐Plot merupakan salah satu metode eksplorasi secara grafik
yang dapat digunakan untuk menguji apakah suatu data berdistribusi
normal. Untuk membuat grafik QQ‐Plot, R menyediakan pilihan QQ‐Plot…
pada menu Grafik. Misalkan akan dibuat QQ‐Plot untuk variabel
LIFEEXPF, maka pada jendela dialog yang muncul, pilih LIFEEXPF seperti
pada Gambar 4.12.
Gambar 4.12. Jendela dialog untuk pilihan variabel dalam pembuatan
QQ‐Plot
Kemudian pilih LIFEEXPF dari daftar variabel dan gunakan distribusi
normal sebagai distribusi default pada QQ‐Plot. Klik OK, maka akan
diperoleh grafik seperti berikut.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 19 | 61
Gambar 4.13. Output QQ‐Plot pada variabel LIFESXPF
Berdasarkan output pada Gambar 4.13 dapat dijelaskan bahwa variabel
LIFEEXPF tidak berdistribusi normal dan data cenderung menceng ke
kanan (ekor lebih panjang di bagian kiri). Hal ini terlihat jelas juga dari
grafik histogramnya (lihat Gambar 4.6).
Command line di R‐Console dapat juga digunakan untuk
pembuatan QQ‐Plot, yaitu dengan command boxplot diikuti argumen
optional yang diinginkan. Berikut adalah contoh pembuatan BoxPlot
dengan command line untuk variabel LIFEEXPF dan LIFEEXPM sendiri‐sendiri
dan berdasarkan variabel RELIGION.
> qq.plot(latihan4$LIFEEXPF, dist= "norm", labels=FALSE)
> qq.plot(latihan4$LIFEEXPM, dist= "norm", labels=FALSE)
II.1.6. Grafik Diagram Pencar (ScatterPlot)
R menyediakan pilihan Diagram pencar… pada menu Grafik
untuk membuat tampilan ScatterPlot dari suatu data. Misalkan akan dibuat
ScatterPlot untuk variabel LIFEEXPF sebagai sumbu Y dan variabel
LOGGDP sebagai sumbu X. Gunakan default untuk pilihan yang lain,
seperti pada Gambar 4.14.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 20 | 61
Gambar 4.14. Jendela dialog pilihan variabel dalam pembuatan Diagram
Pencar
Kemudian pilih LOG_GDP pada variabel X dan LIFEEXPF untuk variabel Y,
dan klik OK, sehingga diperoleh output grafik seperti berikut ini.
Gambar 4.15. Output Diagram Pencar antara variabel LOG_GDP dan
LIFESXPF
Pada output Diagram Pencar, diperoleh juga grafik Box‐Plot dari
setiap marginal variabel, dan garis regresi linear dan non‐parametrik terbaik
untuk menggambarkan hubungan antara kedua variabel ini.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 21 | 61
Command line di R‐Console dapat juga digunakan untuk
pembuatan Diagram Pencar di atas, yaitu dengan command
scatterplot diikuti argumen optional yang diinginkan. Berikut adalah
contoh pembuatan Diagram Pencar dengan command line untuk
variabel LIFEEXPF sebagai sumbu Y, dan LOG_GDP sebagai sumbu X,
seperti perintah di R‐Commander di atas.
> scatterplot(LIFEEXPF~LOG_GDP, reg.line=lm, smooth=TRUE, labels=FALSE,
boxplots='xy', span=0.5, data=latihan4)
II.1.7. Grafik Plot Rata‐rata (Mean)
R menyediakan pilihan Plot Rerata… pada menu Grafik
untuk membuat tampilan Plot Rata‐rata dari suatu data. Misalkan akan
dibuat Plot Rata‐rata untuk variabel LIFEEXPF berdasarkan REGION
(kelompok wilayah negara), maka pada jendela dialog yang muncul, pilih
REGION dan LIFEEXPF seperti pada Gambar 4.16. Klik OK, sehingga
diperoleh output seperti pada Gambar 4.17.
Gambar 4.16. Jendela dialog pilihan variabel dalam pembuatan Plot Rata‐
rata
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 22 | 61
Gambar 4.17. Output Plot Rata‐rata variabel REGION dan LIFESXPF
Pada output Plot Rata‐rata di atas dapat dilihat bahwa LIFEEXPF (usia
harapan hidup wanita) yang terendah rata‐ratanya adalah pada negara‐
negara di Afrika.
Command line di R‐Console untuk pembuatan Plot Rata‐rata
adalah command plotMeans diikuti argumen optional yang diinginkan.
Berikut adalah contoh pembuatan Plot Rata‐rata dengan command line
untuk variabel LIFEEXPF dan REGION.
> plotMeans(latihan4$LIFEEXPF, latihan4$REGION, error.bars="se")
> plotMeans(latihan4$LIFEEXPF, latihan4$REGION, error.bars="conf.int",
level=0.95)
II.1.8. Diagram Batang (Bar‐Chart)
R menyediakan pilihan Diagram batang… pada menu Grafik
untuk membuat tampilan Diagram Batang dari suatu data. Misalkan akan
dibuat Diagram Batang untuk variabel REGION, maka pada jendela
dialog yang muncul, pilih REGION seperti pada Gambar 4.18 berikut ini.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 23 | 61
Gambar 4.18. Jendela dialog pilihan variabel dalam pembuatan Diagram
Batang
Setelah itu klik OK, dan akan diperoleh output Diagram Batang seperti
pada Gambar 4.19. Pada output tersebut dapat dilihat bahwa ada dua
kelompok REGION terbesar, yaitu negara‐negara yang termasuk di
regional OECP dan Amerika Latin.
Command line di R‐Console dapat juga digunakan untuk
pembuatan Diagram Batang, yaitu dengan command barplot diikuti
argumen optional yang diinginkan. Berikut adalah contoh pembuatan
Diagram Batang dengan command line untuk variabel REGION, seperti
perintah di R‐Commander di atas.
> barplot(table(latihan4$REGION), xlab="REGION", ylab="Frequency")
Gambar 4.19. Output Diagram Batang dari variabel REGION
II.1.9. Diagram Lingkaran (Pie‐Chart)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 24 | 61
Tampilan Diagram Lingkaran pada paket R disediakan melalui
pilihan Diagram lingkaran… pada menu Grafik. Misalkan akan dibuat
Diagram Lingkaran untuk variabel REGION, maka pada jendela dialog
yang muncul, pilih REGION seperti pada Gambar 4.20 berikut ini.
Gambar 4.20. Jendela dialog pilihan variabel dalam pembuatan Diagram
Lingkaran
Kemudian klik OK, dan akan diperoleh output Diagram Lingkaran seperti
yang terlihat pada Gambar 4.21.
Gambar 4.21. Output Diagram Lingkaran dari variabel REGION
Command line di R‐Console yang dapat digunakan untuk
pembuatan Diagram Lingkaran adalah pie diikuti argumen optional
yang diinginkan. Berikut adalah contoh pembuatan Diagram Lingkaran
dengan command line untuk variabel REGION, seperti perintah di R‐
Commander di atas.
> pie(table(latihan4$REGION), labels=levels(latihan4$REGION),
main="REGION", col=rainbow(length(levels(latihan4
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 25 | 61
II.1.10. Plot Indeks
Plot Indeks adalah suatu plot dari variabel menurut indeks atau
urutan data. Plot ini dalam analisis data statistik lebih dikenal dengan
Time Series Plot. R menyediakan pilihan Plot Indeks… pada menu
Grafik untuk membuat tampilan Plot Indeks dari suatu data. Pada R‐
Commander ini hanya tersedia dua pilihan tipe dari plot, yaitu Paku dan
Poin. Misalkan akan dibuat Plot Indeks untuk variabel LIFEEXPF, maka pada
jendela dialog yang muncul, pilih LIFEEXPF seperti pada Gambar 4.22.
Dalam hal ini, pilih tipe plot Paku, dan kemudian klik OK, sehingga diperoleh
output Plot Indeks seperti yang terlihat pada Gambar 4.23.
Gambar 4.22. Jendela dialog pilihan variabel dalam pembuatan Plot
Indeks
Gambar 4.23. Output Plot Indeks dari variabel LIFEEXPF
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 26 | 61
Command line di R‐Console yang dapat digunakan untuk
pembuatan Plot Indeks adalah plot diikuti argumen optional yang
diinginkan. Jika akan menampilkan plot berupa garis, maka dapat
digunakan pilihan type=”l”, yang berarti line atau garis. Berikut adalah
contoh pembuatan Plot Indeks dengan command line untuk variabel
LIFEEXPF.
> plot(latihan4$LIFEEXPF, type="h")
> plot(latihan4$LIFEEXPF, type="p")
> plot(latihan4$LIFEEXPF, type="l", main="Time Series Plot Data LIFEEXPF")
Berikut ini adalah output Plot Indeks pada variabel LIFEEXPF dengan pilihan
tipe garis (line) yang dinotasikan dengan “l”.
Gambar 4.24. Output Plot Indeks dari variabel LIFEEXPF dengan type=”l”
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 27 | 61
BAB III
CODING
Membuat Grafik Sederhana Dengan R
Line Charts/Grafik Garis
Pertama kita akan menghasilkan grafik
yang sangat sederhana dengan
menggunakan nilai-nilai dalam vektor
mobil:
# Tentukan vektor mobil dengan nilai 5
cars <- c(1, 3, 6, 4, 9)
# Buatlah grafik untuk vektor mobil dengan
semua setelan menjadi default
plot(cars)
Tambahkan judul, garis untuk
menghubungkan titik-titik, dan beberapa
warna:
# Tentukan vektor mobil dengan nilai 5
cars <- c(1, 3, 6, 4, 9)
# Grafik mobil menggunakan titik biru
dilapisi oleh garis
plot(cars, type="o", col="blue")
# Buatlah judul dengan warna merah,
hurufnya dapat di-bold/italic
title(main="Autos", col.main="red",
font.main=4)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 28 | 61
Sekarang mari kita menambahkan garis
merah untuk truk dan menentukan rentang
y-axis secara langsung sehingga akan
cukup luas agar sesuai dengan data truk:
# Tentukan 2 vektor
cars <- c(1, 3, 6, 4, 9)
trucks <- c(2, 5, 4, 5, 12)
# Grafik mobil menggunakan sumbu Y
yang berkisar 0-12
plot(cars, type="o", col="blue",
ylim=c(0,12))
# Grafik truk dengan garis putus-putus
merah dan poin persegi
lines(trucks, type="o", pch=22, lty=2,
col="red")
# Buatlah judul dengan warna merah,
hurufnya dapat di-bold/italic
title(main="Autos", col.main="red",
font.main=4)
Selanjutnya mari kita mengubah label
sumbu untuk mencocokkan data dan
menambahkan legenda. Kita juga akan
menghitung nilai sumbu y menggunakan
fungsi max sehingga setiap perubahan
data akan secara otomatis tercermin
dalam grafik.
# Tentukan 2 vektor
cars <- c(1, 3, 6, 4, 9)
trucks <- c(2, 5, 4, 5, 12)
# Hitung berkisar dari 0 sampai nilai maks
mobil dan truk
g_range <- range(0, cars, trucks)
# Grafik autos menggunakan sumbu y
yang berkisar dari 0 sampai max
# Nilai dalam mobil atau truk vektor.
Nonaktifkan sumbu dan
# Penjelasan (label sumbu) sehingga kita
bisa menetapkannya sendiri
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 29 | 61
plot(cars, type="o", col="blue",
ylim=g_range,
axes=FALSE, ann=FALSE)
# Buatlah sumbu x menggunakan label
Mon-Fri
axis(1, at=1:5,
lab=c("Mon","Tue","Wed","Thu","Fri"))
# Buatlah sumbu y dengan label
horizontal yang menampilkan ditandai di
# Setiap 4 tanda. 4*0:g_range[2] adalah
sama dengan c(0,4,8,12).
axis(2, las=1, at=4*0:g_range[2])
# Buat kotak di sekitar plot
box()
# Grafik truk dengan garis putus-putus
merah dan poin persegi
lines(trucks, type="o", pch=22, lty=2,
col="red")
# Buatlah judul dengan warna merah,
hurufnya dapat di-bold/italic
title(main="Autos", col.main="red",
font.main=4)
# Label sumbu x dan y dengan teks hijau
gelap/tua
title(xlab="Days", col.lab=rgb(0,0.5,0))
title(ylab="Total", col.lab=rgb(0,0.5,0))
# Buat legenda di (1, g_range[2]) yang
sedikit lebih kecil
# (cex) dan menggunakan warna baris
yang sama dan poin yang digunakan oleh
# Plot sebenarnya
legend(1, g_range[2], c("cars","trucks"),
cex=0.8,
col=c("blue","red"), pch=21:22, lty=1:2);
Sekarang mari kita membaca data grafik
secara langsung dari file tab-delimited. File
tersebut berisi paket tambahan nilai untuk
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 30 | 61
SUV. Kita akan menyimpan file dalam
direktori C :/ R (Anda akan menggunakan
cara yang berbeda jika tidak
menggunakan Windows).
autos.dat
autos.dat
cars trucks suvs
1 2 4
3 5 4
6 4 6
4 5 6
9 12 16
Kita juga akan menggunakan vektor untuk
menyimpan warna yang akan digunakan
dalam grafik, jadi jika kita ingin mengubah
warna nanti, hanya ada satu tempat
dalam file yang perlu dimodifikasi. Akhirnya
kita akan mengirimkan gambar langsung
ke file PNG.
# Baca nilai mobil dan truk dari tab-
delimited autos.dat
autos_data <- read.table("C:/R/autos.dat",
header=T, sep="\t")
# Hitung nilai y terbesar yang digunakan
dalam data (atau kita bisa
# Hanya menggunakan rentang lagi)
max_y <- max(autos_data)
# Tentukan warna yang akan digunakan
untuk mobil, truk, SUV
plot_colors <- c("blue","red","forestgreen")
# Mulai driver perangkat PNG untuk
menyimpan output ke figure.png
png(filename="C:/R/figure.png",
height=295, width=300,
bg="white")
# Grafik autos menggunakan sumbu y
yang berkisar dari 0 sampai max_y.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 31 | 61
# Nonaktifkan sumbu dan penjelasan
(label sumbu) sehingga kita bisa
# Menentukannya sendiri
plot(autos_data$cars, type="o",
col=plot_colors[1],
ylim=c(0,max_y), axes=FALSE,
ann=FALSE)
# Buat sumbu x menggunakan label Mon-
Fri
axis(1, at=1:5, lab=c("Mon", "Tue", "Wed",
"Thu", "Fri"))
# Buatlah sumbu y dengan label
horizontal yang menampilkan ditandai di
# Setiap 4 tanda. 4*0:max_y adalah sama
dengan c(0,4,8,12).
axis(2, las=1, at=4*0:max_y)
# Buat kotak sekitar plot
box()
# Grafik truk dengan garis putus-putus
merah dan poin persegi
lines(autos_data$trucks, type="o", pch=22,
lty=2,
col=plot_colors[2])
# Grafik SUV dengan garis putus-putus
berwarna hijau dan titik berlian
lines(autos_data$suvs, type="o", pch=23,
lty=3,
col=plot_colors[3])
# Buatlah judul dengan warna merah,
hurufnya dapat di-bold/italic
title(main="Autos", col.main="red",
font.main=4)
# Label sumbu x dan y dengan teks hijau
gelap/tua
title(xlab= "Days", col.lab=rgb(0,0.5,0))
title(ylab= "Total", col.lab=rgb(0,0.5,0))
# Buat legenda di (1, max_y) yang sedikit
lebih kecil
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 32 | 61
# (cex) dan menggunakan warna baris
yang sama dan poin yang digunakan
oleh
# Plot sebenarnya
legend(1, max_y, names(autos_data),
cex=0.8, col=plot_colors,
pch=21:23, lty=1:3);
# Matikan device driver (untuk output
secara langsung ke png)
dev.off()
Dalam contoh berikut ini, kita akan
menyimpan file ke PDF dan memotong
spasi ekstra sekitar grafik, ini berguna ketika
ingin menggunakan angka di LaTeX. Kami
juga akan meningkatkan lebar garis,
mengecilkan ukuran font sumbu, dan
memiringkan sumbu x label ke 45 derajat.
# Baca nilai mobil dan truk dari tab-
delimited autos.dat
autos_data <-
read.table("C:/R/autos.dat", header=T,
sep="\t")
# Tentukan warna yang akan digunakan
untuk mobil, truk, SUV
plot_colors <- c(rgb(r=0.0,g=0.0,b=0.9),
"red", "forestgreen")
# Mulai driver perangkat PDF untuk
menyimpan output ke figure.pdf
pdf(file="C:/R/figure.pdf", height=3.5,
width=5)
# Memotong ruang marjin berlebih
(bawah, kiri, atas, kanan)
par(mar=c(4.2, 3.8, 0.2, 0.2))
# Grafik autos menggunakan sumbu Y
yang menggunakan berbagai nilai
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 33 | 61
# Di autos_data. Label sumbu dengan
font yang lebih kecil dan gunakan lebih
besar
# Lebar garis.
plot(autos_data$cars, type="l",
col=plot_colors[1],
ylim=range(autos_data), axes=F, ann=T,
xlab="Days",
ylab="Total", cex.lab=0.8, lwd=2)
# Membuat tanda centang sumbu x
tanpa label
axis(1, lab=F)
# Plot label sumbu x pada tanda centang
default dengan label di
# Sudut 45 derajat
text(axTicks(1), par("usr")[3] - 2, srt=45,
adj=1,
labels=c("Mon", "Tue", "Wed", "Thu",
"Fri"),
xpd=T, cex=0.8)
# Plot sumbu y horisontal dengan label
yang lebih kecil
axis(2, las=1, cex.axis=0.8)
# Buat kotak sekitar plot
box()
# Grafik truk dengan garis tebal putus-
putus merah
lines(autos_data$trucks, type="l", lty=2,
lwd=2,
col=plot_colors[2])
# Grafik SUV dengan garis tebal putus-
putus berwarna hijau
lines(autos_data$suvs, type="l", lty=3,
lwd=2,
col=plot_colors[3])
# Buat legenda di sudut kiri atas yang
sedikit
# Lebih kecil dan tidak memiliki batas
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 34 | 61
legend("topleft", names(autos_data),
cex=0.8, col=plot_colors,
lty=1:3, lwd=2, bty="n");
# Matikan device driver (untuk output
secara langsung ke png)
dev.off()
# Mengembalikan margin standar
par(mar=c(5, 4, 4, 2) + 0.1)
Bar Charts/Grafik Batang
Mari kita mulai dengan bar chart
sederhana grafik vektor mobil:
# Tentukan vektor mobil dengan nilai 5
cars <- c(1, 3, 6, 4, 9)
# Grfik mobil
barplot(cars)
Mari kita sekarang membaca data
otomatis dari file data autos.dat,
menambahkan label, perbatasan biru di
sekitar bar, dan garis kepadatan:
# Baca nilai dari tab-delimited autos.dat
autos_data <- read.table("C:/R/autos.dat",
header=T, sep="\t")
# Grafik mobil dengan label tertentu
untuk sumbu. Gunakan batas
# Biru dan garis diagonal di bar.
barplot(autos_data$cars, main="Cars",
xlab="Days",
ylab="Total",
names.arg=c("Mon","Tue","Wed","Thu","Fri")
,
border="blue", density=c(10,20,30,40,50))
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 35 | 61
Sekarang mari kita grafik jumlah autos per
hari dengan menggunakan beberapa
warna dan menunjukkan legenda:
# Baca nilai dari tab-delimited autos.dat
autos_data <-
read.table("C:/R/autos.dat", header=T,
sep="\t")
# Grafik autos dengan bar yang
berdekatan menggunakan warna pelangi
barplot(as.matrix(autos_data),
main="Autos", ylab= "Total",
beside=TRUE, col=rainbow(5))
# Tempatkan legenda di sudut kiri atas
dengan tanpa frame
# menggunakan warna pelangi
legend("topleft",
c("Mon","Tue","Wed","Thu","Fri"), cex=0.6,
bty="n", fill=rainbow(5));
Mari kita grafik jumlah autos per hari
menggunakan grafik batang ditumpuk
dan tempat legenda di luar area plot:
# Baca nilai dari tab-delimited autos.dat
autos_data <-
read.table("C:/R/autos.dat", header=T,
sep="\t")
# Memperluas sisi kanan rect kliping untuk
memberikan ruang bagi legenda
par(xpd=T, mar=par()$mar+c(0,0,0,4))
# Grafik autos (transposing matriks)
dengan menggunakan warna panas,
# Menempatkan 10% dari ruang antara
setiap batang, dan membuat label
# Lebih kecil dengan horisontal label
sumbu y
barplot(t(autos_data), main="Autos",
ylab="Total",
col=heat.colors(3), space=0.1,
cex.axis=0.8, las=1,
names.arg=c("Mon","Tue","Wed","Thu","Fri")
, cex=0.8)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 36 | 61
# Tempatkan legenda di (6,30)
menggunakan warna panas
legend(6, 30, names(autos_data), cex=0.8,
fill=heat.colors(3));
# Kembalikan default kliping rect
par(mar=c(5, 4, 4, 2) + 0.1)
Histograms
Mari kita mulai dengan histogram
sederhana grafik distribusi vektor SUV:
# Tentukan vektor SUV dengan nilai 5
suvs <- c(4,4,6,6,16)
# Buat histogram untuk SUV
hist(suvs)
Mari kita sekarang membaca data
otomatis dari file data autos.dat dan plot
histogram dari mobil gabungan, truk, dan
data suv dalam warna.
# Baca nilai dari tab-delimited autos.dat
autos_data <- read.table("C:/R/autos.dat",
header=T, sep="\t")
# Menggabungkan tiga vektor
autos <- c(autos_data$cars,
autos_data$trucks,
autos_data$suvs)
# Buat histogram untuk autos dalam biru
muda dengan sumbu y
# Berkisar dari 0-10
hist(autos, col="lightblue", ylim=c(0,10))
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 37 | 61
Sekarang mengubah menjadi pecah
sehingga tak satu pun dari nilai
dikelomokkan bersama dan membalik
label sumbu y secara horisontal.
# Baca nilai dari tab-delimited autos.dat
autos_data <-
read.table("C:/R/autos.dat", header=T,
sep="\t")
# Menggabungkan tiga vektor
autos <- c(autos_data$cars,
autos_data$trucks,
autos_data$suvs)
# Hitung nilai y terbesar digunakan dalam
autos
max_num <- max(autos)
# Buat histogram untuk mobil dengan
warna api, mengatur break
# Jadi setiap nomor berada pada
kelompoknya sendiri, membuat berbagai
sumbu x dari
# 0-max_num, menonaktifkan right-closing
interval sel, mengatur
# Judul, dan membuat label sumbu y
horizontal
hist(autos, col=heat.colors(max_num),
breaks=max_num,
xlim=c(0,max_num), right=F,
main="Autos Histogram", las=1)
Sekarang mari kita membuat pecah
merata dan grafik kepadatan probabilitas.
# Read values from tab-delimited
autos.dat
autos_data <-
read.table("C:/R/autos.dat", header=T,
sep="\t")
# Menggabungkan tiga vektor
autos <- c(autos_data$cars,
autos_data$trucks,
autos_data$suvs)
# Hitung nilai y terbesar digunakan dalam
autos
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 38 | 61
max_num <- max(autos)
# Buat pecah merata
brk <- c(0,3,4,5,6,10,16)
# Buat histogram untuk mobil dengan
warna api, mengatur merat
# Pecah, membuat berbagai sumbu x dari
0-MAX_NUM, menonaktifkan right-
# closing Dari interval sel, mengatur judul,
membuat label sumbu y
# Horisontal, membuat label sumbu yang
lebih kecil, membuat daerah masing-
masing
# Sebanding dengan jumlah kolom
hist(autos, col=heat.colors(length(brk)),
breaks=brk,
xlim=c(0,max_num), right=F,
main="Probability Density",
las=1, cex.axis=0.8, freq=F)
Dalam contoh ini kita akan merencanakan
distribusi dari 1000 nilai acak yang memiliki
distribusi log-normal.
# Dapatkan distribusi log-normal acak
r <- rlnorm(1000)
hist(r)
Karena log-normal distribusi normal terlihat
lebih baik daripada sumbu log-log, mari
kita gunakan fungsi plot dengan poin
untuk menunjukkan distribusi.
# Dapatkan distribusi log-normal acak
r <- rlnorm(1000)
# Dapatkan distribusi tanpa
merencanakan menggunakan pecah
yang ketat.
h <- hist(r, plot=F,
breaks=c(seq(0,max(r)+1, .1)))
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 39 | 61
# Plot distribusi menggunakan skala log
pada kedua sumbu, dan menggunakan
# Poin biru
plot(h$counts, log="xy", pch=20,
col="blue",
main="Log-normal distribution",
xlab="Value", ylab="Frequency")
Pie Charts/Grafik Kue(Lingkaran)
Mari kita mulai dengan pie chart
sederhana grafik vektor mobil:
# Tentukan vektor mobil dengan nilai 5
cars <- c(1, 3, 6, 4, 9)
# Buat pie chart untuk mobil
pie(cars)
Sekarang mari kita menambahkan judul,
mengubah warna, dan menentukan label
kita sendiri:
# Tentukan vektor mobil dengan nilai 5
cars <- c(1, 3, 6, 4, 9)
# Buat pie chart dengan judul yang
ditetapkan dan
# Kustom warna dan label
pie(cars, main="Cars",
col=rainbow(length(cars)),
labels=c("Mon","Tue","Wed","Thu","Fri"))
Sekarang mari kita mengubah warna,
label menggunakan persentase, dan
membuat legenda:
# Tentukan vektor mobil dengan nilai 5
cars <- c(1, 3, 6, 4, 9)
# Tentukan beberapa warna yang ideal
untuk cetak hitam & putih
colors <-
c("white","grey70","grey90","grey50","blac
k")
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 40 | 61
# Hitung persentase untuk setiap hari,
dibulatkan menjadi satu
# tempat desimal
car_labels <- round(cars/sum(cars) * 100,
1)
# Menyatukan '%' char setelah setiap nilai
car_labels <- paste(car_labels, "%",
sep="")
# Buat pie chart dengan judul yang
ditetapkan dan warna kustom
# and labels
pie(cars, main="Cars", col=colors,
labels=car_labels,
cex=0.8)
# Buat legenda di bagian kanan
legend(1.5, 0.5,
c("Mon","Tue","Wed","Thu","Fri"), cex=0.8,
fill=colors)
Dotcharts/Grafik Titik
Mari kita mulai dengan dotchart
sederhana grafik data autos:
# Baca nilai dari tab-delimited autos.dat
autos_data <-
read.table("C:/R/autos.dat", header=T,
sep="\t")
# Buat dotchart untuk autos
dotchart(t(autos_data))
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 41 | 61
Mari kita membuat dotchart yang sedikit
lebih berwarna:
# Baca nilai dari tab-delimited autos.dat
autos_data <-
read.table("C:/R/autos.dat", header=T,
sep="\t")
# Buat dotchart berwarna untuk mobil
dengan label yang lebih kecil
dotchart(t(autos_data),
color=c("red","blue","darkgreen"),
main="Dotchart for Autos", cex=0.8)
Misc/Lain-lain
Contoh ini menunjukkan semua 25 simbol
yang dapat Anda gunakan untuk
menghasilkan poin dalam grafik Anda:
# Membuat tabel kosong
plot(1, 1, xlim=c(1,5.5), ylim=c(0,7),
type="n", ann=FALSE)
# Plot digit 0-4 dengan bertambahnya
ukuran dan warna
text(1:5, rep(6,5), labels=c(0:4), cex=1:5,
col=1:5)
# Plot simbol 0-4 dengan bertambahnya
ukuran dan warna
points(1:5, rep(5,5), cex=1:5, col=1:5,
pch=0:4)
text((1:5)+0.4, rep(5,5), cex=0.6, (0:4))
# Plot simbol 5-9 dengan label
points(1:5, rep(4,5), cex=2, pch=(5:9))
text((1:5)+0.4, rep(4,5), cex=0.6, (5:9))
# Plot simbol 10-14 dengan label
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 42 | 61
points(1:5, rep(3,5), cex=2, pch=(10:14))
text((1:5)+0.4, rep(3,5), cex=0.6, (10:14))
# Plot simbol 15-19 dengan label
points(1:5, rep(2,5), cex=2, pch=(15:19))
text((1:5)+0.4, rep(2,5), cex=0.6, (15:19))
# Plot simbol 20-25 dengan label
points((1:6)*0.8+0.2, rep(1,6), cex=2,
pch=(20:25))
text((1:6)*0.8+0.5, rep(1,6), cex=0.6,
(20:25))
Membuat Histogram & Polygon pada R-Programming
- Langkah pertama masukkan nilai mahasiswa dengan data berikut :
> data = c(41, 45, 49, 51, 52, 53, 55, 56, 63, 57, 57, 58, 59, 60, 61, 67, 62, 56,
63, 35, 65, 65, 65, 67, 67, 73, 61, 69, 69, 96, 69, 70, 71, 71, 77, 79, 73, 93, 73,
81, 75, 75, 77, 77, 89, 67, 79, 79, 81, 59, 83, 83, 87, 89, 71, 92, 81, 65, 84, 73)
> data
maka akan keluar
[1] 41 45 49 51 52 53 55 56 63 57 57 58 59 60 61 67 62 56 63 35 65 65 65 67 67
[26] 73 61 69 69 96 69 70 71 71 77 79 73 93 73 81 75 75 77 77 89 67 79 79 81 59
[51] 83 83 87 89 71 92 81 65 84 73
- Kemudian kita urutkan nilai dari urutan terkecil sampai terbesar dengan
menggunakan rumus :
> sort(data)
Outputnya :
[1] 35 41 45 49 51 52 53 55 56 56 57 57 58 59 59 60 61 61 62 63 63 65 65 65 65
[26] 67 67 67 67 69 69 69 70 71 71 71 73 73 73 73 75 75 77 77 77 79 79 79 81 81
[51] 81 83 83 84 87 89 89 92 93 96
- Selanjutnya kita cari nilai terkecil dengan menggunakan rumus :
> min(data)
Outputnya : [1] 35
- Lalu kita cari nilai terbesar dengan menggunakan rumus :
> max(data)
Outputnya : [1] 96
- Bila kita ingin mengetahui jumlah data yang dimasukkan dengan
menggunakan rumus :
> length(data)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 43 | 61
Outputnya : [1] 60
- Kemudian masukkan rumus :
> jmlkls = 1+(3.322*log10(length(data)))
> jmlkls
Outputnya : [1] 6.907018
- Untuk membulatkan nilai hasil dari jmlkls menggunakan rumus :
> round(jmlkls)
Outputnya : [1] 7
- Selanjutnya mencari jangkauan dari data menggunakan rumus :
> jang = max(data) - min(data)
> jang
Outputnya : [1] 61
- Kemudian mencari interval dari data menggunakan rumus :
> int = jang/jmlkls
> int
Outputnya : [1] 8.831596
- Untuk membulatkan nilai hasil dari inteval menggunakan rumus :
> round(int)
Outputnya : [1] 9
Perhatikan gambar dibawah ini :
- Setelah itu kita buat tabel dengan cara masukkan rumus : >
tabel=edit(data.frame())
Kemudian ubahlah nama Var 1 menjadi Kelas dengan type character.
Lihat gambar dibawah :
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 44 | 61
- Selanjutnya isi data tabel sesuai kelas-kelas yang di tentukan
Maka akan terlihat seperti gambar dibawah ini :
- Setelah mengisi kelas seperti gambar di atas kemudian close tabel
- Sekarang kita cari frekuensi dengan rumus :
frek = function (x,y,z)
+ {
+ a = 0
+ for (i in 1 : length (x))
+ {
+ if (x[i]>=y && x[i]<=z)
+ {
+ a = a+1
+ }
+ }
+ print (a)
+ }
Lihat gambar dibawah ini :
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 45 | 61
- Kemudian kita isi data frekuensi sesuai kelas yang ditentukan dengan
rumus :
> frek (data,35,43)
[1] 2
> frek (data,44,52)
[1] 4
> frek (data,53,61)
[1] 12
> frek (data,62,70)
[1] 15
> frek (data,71,79)
[1] 15
> frek (data,80,88)
[1] 7
> frek (data,89,97)
[1] 5
- Setelah selesai data tadi dimasukkan kedalam data frekuensi dengan
cara menggunakan rumus :
> fr = c (2,4,12,15,15,7,5)
Lalu
> fr
[1] 2 4 12 15 15 7 5
Lihat gambar dibawah ini :
- Jika kita ingin melihat tabel frekuensi kita masukkan rumus :
> tabel $ frekuensi <-fr
> tabel
Maka akan terbentuk tabel seperti dibawah ini :
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 46 | 61
- Selanjutnya kia isi data mean sesuai kelas yang ditentukan dengan cara
masukkan rumus :
> mean (35:43)
[1] 39
> mean (44:52)
[1] 48
> mean (53:61)
[1] 57
> mean (62:70)
[1] 66
> mean (71:79)
[1] 75
> mean (80:88)
[1] 84
> mean (89:97)
[1] 93
- Setelah selesai data tadi dimasukkan kedalam data mean dengan cara
menggunakan rumus :
> me = c (39,48,57,66,75,84,93)
Lalu
> me
[1] 39 48 57 66 75 84 93
Lihat gambar dibawah ini :
- Jika kita ingin melihat tabel mean kita masukkan rumus :
> tabel $ mean <-me
> tabel
Maka akan terbentuk tabel seperti dibawah ini :
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 47 | 61
- Kemudian kita tampilkan histogram Nilai Mahasiswa dengan cara
masukkan rumus :
> hist (data, main = "Nilai Mahasiswa")
Maka akan seperti gambar dibawah ini :
- Selanjutnya kita tampilkan polygon Nilai Mahasiswa dengan cara
masukkan rumus :
> plot (me, fr, main = "Nilai Mahasiswa")
Maka akan keluar output seperti ini :
- Bila ingin memberikan warna pada polygon masukkan rumus :
> polygon (me, fr, col = "black" , border = "red")
Maka outputnya akan seperti gambar dibawah ini :
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 48 | 61
Boxplot
Boxplots dapat dibuat untuk setiap variabel atau variabel oleh kelompok.
Formatnya adalah boxplot (x, data =), di mana x adalah rumus dan data =
menunjukkan frame data menyediakan data. Contoh dari rumus adalah y
~ kelompok dimana boxplot terpisah untuk y variabel numerik yang
dihasilkan untuk setiap nilai kelompok. Tambahkan varwidth = TRUE untuk
membuat lebar boxplot sebanding dengan akar kuadrat dari ukuran
sampel. Tambahkan horisontal = TRUE untuk membalikkan orientasi sumbu.
# Boxplot of MPG by Car Cylinders
boxplot(mpg~cyl,data=mtcars, main="Car Milage Data",
xlab="Number of Cylinders", ylab="Miles Per Gallon")
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 49 | 61
# Notched Boxplot of Tooth Growth Against 2 Crossed Factors
# boxes colored for ease of interpretation
boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE,
col=(c("gold","darkgreen")),
main="Tooth Growth", xlab="Suppliment and Dose")
Dalam boxplot berlekuk, jika dua kotak 'notches tidak tumpang tindih ini
adalah' bukti kuat ' median mereka berbeda
Scatterplots
Ada banyak cara untuk membuat scatterplot di R. Fungsi dasar adalah plot
(x, y), di mana x dan y adalah vektor numerik yang menunjukkan (x, y) poin
untuk plot.
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 50 | 61
# Simple Scatterplot
attach(mtcars)
plot(wt, mpg, main="Scatterplot Example",
xlab="Car Weight ", ylab="Miles Per Gallon ", pch=19)
# Add fit lines
abline(lm(mpg~wt), col="red") # regression line (y~x)
lines(lowess(wt,mpg), col="blue") # lowess line (x,y)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 51 | 61
The scatterplot () fungsi dalam paket mobil menawarkan fitur yang
disempurnakan, termasuk garis fit, plot kotak marjinal, pengkondisian pada
faktor, dan identifikasi titik interaktif. Masing-masing fitur adalah opsional.
# Enhanced Scatterplot of MPG vs. Weight
# by Number of Car Cylinders
library(car)
scatterplot(mpg ~ wt | cyl, data=mtcars,
xlab="Weight of Car", ylab="Miles Per Gallon",
main="Enhanced Scatter Plot",
labels=row.names(mtcars))
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 52 | 61
Generic X-Y Plotting
Contoh :
require(stats)
plot(cars)
lines(lowess(cars))
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 53 | 61
plot(sin, -pi, 2*pi) # see ?plot.function
## Discrete Distribution Plot:
plot(table(rpois(100, 5)), type = "h", col = "red", lwd = 10,
main = "rpois(100, lambda = 5)")
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 54 | 61
## Simple quantiles/ECDF, see ecdf() {library(stats)} for a better one:
plot(x <- sort(rnorm(47)), type = "s", main = "plot(x, type = \"s\")")
points(x, cex = .5, col = "dark red")
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 55 | 61
Stem-and-Leaf chart
Untuk melihat pola data, khususnya untuk data dengan jumlah sedikit biasa
digunakan diagram dahan-dan-daun. Fungsi stem() memperagakan
diagram ini.
Teladan: Data berikut ini adalah lamanya waktu (dalam menit) yang
diperlukan untuk menunggu lift di UBINUS kampus anggrek, sehingga dapat
digunakan.
2 3 16 23 14 12 4 13 2 0 0 0 6 28 31 14 4 8 2 5
> lift<-scan()
1: 2 3 16 23 14 12 4 13 2 0 0 0 6 28 31 14 4 8 2 5
21:
Read 20 items
Bila lupa nama persisnya dari fungsi stem, maka dapat dicari dengan
menggunakan fungsi apropos().
> apropos("stem")
[1] "stem" "system" "system.file" "system.time"
> stem(lift)
The decimal point is 1 digit(s) to the right of the |
0 | 000222344568
1 | 23446
2 | 38
3 | 1
> stem(lift,scale=2)
The decimal point is 1 digit(s) to the right of the |
0 | 000222344
0 | 568
1 | 2344
1 | 6
2 | 3
2 | 8
3 | 1
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 56 | 61
Quantile-Quantile Plots
Contoh :
y <- rt(200, df = 5)
qqnorm(y); qqline(y, col = 2)
qqplot(y, rt(300, df = 5))
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 57 | 61
qqnorm(precip, ylab = "Precipitation [in/yr] for 70 US cities")
Stripchart
x <- stats::rnorm(50)
xr <- round(x, 1)
stripchart(x) ; m <- mean(par("usr")[1:2])
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 58 | 61
text(m, 1.04, "stripchart(x, \"overplot\")")
stripchart(xr, method = "stack", add = TRUE, at = 1.2)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 59 | 61
text(m, 1.35, "stripchart(round(x,1), \"stack\")")
stripchart(xr, method = "jitter", add = TRUE, at = 0.7)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 60 | 61
text(m, 0.85, "stripchart(round(x,1), \"jitter\")")
stripchart(decrease ~ treatment,
main = "stripchart(OrchardSprays)",
vertical = TRUE, log = "y", data = OrchardSprays)
R-GRAPH – Probabilitas Dan Statistika
H a l a m a n 61 | 61
stripchart(decrease ~ treatment, at = c(1:8)^2,
main = "stripchart(OrchardSprays)",
vertical = TRUE, log = "y", data = OrchardSprays)
R-GRAPH – Probabilitas Dan Statistika
ii
REFERENSI
Wilkinson, Leland (1999). "Dot plots". The American Statistician (American
Statistical Association) 53 (3): 276–281. doi:10.2307/2686111. JSTOR
2686111.
Cleveland, William S. (1993). Visualizing Data. Hobart Press. ISBN 0-9634884-
0-6. hdl:2027/mdp.39015026891187.
Suhartono. 2008. Analisi Data Statik Dengan R. Surabaya : Lab. Statistik
Komputasi ITS. Panduan Praktikum Komputer Statistika. Bogor : Institut
Pertanian Bogor.
http://carapedia.com/pengertian_definisi_grafik_info2124.html 26/12/2012
http://www.harding.edu/fmccown/r/#autosdatafile
http://id.wikipedia.org/wiki/Histogram
http://sixsigmaindonesia.com/sekilas-mengenai-histogram/
http://defri-z.blogspot.com/2011/10/membuat-tabel-frekuensi-mean-
pada-r.html
http://bahasa-r.blogspot.com/2008/12/manipulasi-data-dan-grafik-
menggunakan.html
http://www.statmethods.net/graphs/boxplot.html
http://www.statmethods.net/graphs/scatterplot.html
http://stat.ethz.ch/R-manual/R-devel/library/graphics/html/plot.html
http://en.wikipedia.org/wiki/Scatter_plot
http://bahasa-r.blogspot.com/2009/03/manul-bahasa-r.html “MANUAL-R”
http://astrostatistics.psu.edu/datasets/2006tutorial/html/stats/html/qqnorm.
html
http://stat.ethz.ch/R-manual/R-devel/library/graphics/html/stripchart.html