PENGGUNAAN BIGLM DAN BIGANALYTICS DALAM R Dosen Pengampu : Dr. Danardono, MPH Vemmie Nastiti Lestar, S.Si., M.Sc Disusun Oleh : Nanda Noor Harkam Ansol (14/366258/PA/16236) Angelia Trince Monekaka (14/366174//PA/16220) Tri Mulyaningsih (14/366175/PA/16221) Novika Purba (14/368612/PA/16296) PROGRAM STUDI STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA
22
Embed
danardono.staff.ugm.ac.iddanardono.staff.ugm.ac.id/matakuliah/bigdata/kel09 BIGLM... · Web viewPENGGUNAAN BIGLM DAN BIGANALYTICS DALAM RDosen Pengampu : Dr. Danardono, MPHVemmie
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
PENGGUNAAN BIGLM DAN BIGANALYTICS DALAM R
Dosen Pengampu : Dr. Danardono, MPH
Vemmie Nastiti Lestar, S.Si., M.Sc
Disusun Oleh :
Nanda Noor Harkam Ansol (14/366258/PA/16236)
Angelia Trince Monekaka (14/366174//PA/16220)
Tri Mulyaningsih (14/366175/PA/16221)
Novika Purba (14/368612/PA/16296)
PROGRAM STUDI STATISTIKA DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS GADJAH MADA
YOGYAKARTA
2017
BAB I
PENDAHULUAN
1. Latar Belakang Masalah
Salah satu library di R yang cukup penting dan sangat sering digunakan adalah
lm(). Lm() digunakan untuk memfitting model-model linier seperti regresi linier, anava
satu arah, dan analisis covariansi. Meskipun penggunaan library lm dalam regresi linier
sangat umum dilakukan akan muncul permasalahan baru apabila data yang akan
dianalisis berukuran cukup besar. Hal ini dikarenakan apabila dalam analisis regresi
menggunakann library lm maka user harus menyertakan keseluruhan data sehingga
memori yang dibutuhkan cukup besar. Oleh karena itu, digunakanlah library biglm untuk
analisis regersi dengan data yang cukup besar.
Biglm menawarkan beberapa keuntungan diantaranya, biglm dalam analisis hanya
menyimpan data sebesar p2 dengan p adalah banyaknya variabel yang digunakan. Selain
itu biglm menawarkan fasilitas update. Fasilitas update dapat digunakan untuk
menganalisis regresi terhadap data yang telah dipartisi menjadi beberapa bagian. Idenya
adalah meregresikan data partisi tertentu kemudian setelah di analisis dan didapatkan
hasilnya akan digunakan fasilitas update dengan menambahkan data baru yang berasal
dari partisi yang lain. Dengan cara ini maka memori yang digunakan lebih kecil karena
gagasan dari fungsi biglm adalah menyimpan data ke dalam memori hanya pada saat di
running.
Big analytics merupakan package analisis yang digunakan untuk data berukuran
besar. Analisis yang terdapat pada package biganalytics diantaranya ada biglm.big.matrix,
bigglm.big.matrix, bigkmeans, binit, dan penerapan untuk big.matrix.objects.
2. Rumusan Masalah
a. Bagaimana perbedaan antara biglm dan lm?
b. Bagaimana penggunaan fasilitas update pada packages biglm?
c. Bagaimana perbedaan antara analisis pada matrix biasa dengan matrix menggunakan
package biganalytics?
3. Tujuan
a. Mengetahui penggunaan packages biglm dan biganalytics.
b. Mengetahui penggunaan fasilitas update pada biglm.
BAB II
LANDASAN TEORI
1. Package Biglm
Biglm membuat/menciptakan objek model linier hanya dengan menggunakan
memori p^2 untuk variabel p. Data ini dapat diperbarui dengan menggunakan lebih
banyak update data. Model ini memungkinkan untuk menjalankan regresi linear pada
data set yang lebih besar dari pada memorynya.
Dalam package biglm, terdapat fungsi bigglm, bigglm.data.frame,