Teknologi Infrastruktur 1 Rencana Penanggulangan Bencana Layanan TI
Feb 02, 2016
Teknologi Infrastruktur
1
Rencana Penanggulangan
Bencana Layanan TI
Sasaran
2
Memahami konsep Business Continuity Planning (perencanaan kontinuitas layanan TI).
Memahami strategi pemulihan layanan TI dalam Disaster Recovery Plan (rencana penanggulangan bencana).
Business Continuity Plan (BCP)
3
Kontinuitas layanan TI perusahaan harus dijaga dari gangguan:Bencana alamUlah manusia (disengaja atau tidak)Kerusakan.
Dibutuhkan perencanaan untuk mencegah, menangani, dan menanggulangi gangguanPolicy dan prosedur penanganan bencana.Strategi pemulihan layanan.Strategi minimasi dampak bencana.
Fase Penanganan Bencana
4
Tidak semua insiden berstatus bencanaDitentukan oleh hasil evaluasi.
Pemulihan layanan menggunakan fasilitas alternatif/cadangan atau secara manual.
Perbaikan dapat berupa pemindahan lokasi layanan.
insidenEvaluasi
Kerusakan
PemulihanLayanan Vital
PerbaikanKerusakan
RestorasiLayanan
Notifikasi
Tahapan BC Planning
5
Tahapan perencanaan:1. Penyusunan policy rencana darurat.2. Analisa dampak bisnis (dari gangguan).3. Identifikasi mekanisme pencegahan.4. Pengembangan strategi pemulihan
layanan.5. Penyusunan prosedur penanganan situasi
darurat.6. Uji coba, pelatihan, dan latihan prosedur
darurat.7. Reevaluasi rencana penanganan situasi
darurat.
Proses Pengembangan BCP
6
1. Penyusunan Policy Identifikasi peraturan perundangan yang
mempersyaratkan perencanaan situasi darurat.
Penyusunan kebijakan penanganan situasi darurat.
Mendapatkan persetujuan. Mensosialisasikan policy.
Proses Pengembangan BCP
7
2. Analisa Dampak terhadap bisnis Identifikasi sumber daya TI vital. Identifikasi dampak gangguan dan batas
lamanya gangguan. Menyusun prioritas pemulihan sumber
daya TI.
3. Identifikasi mekanisme pencegahan Implementasi mekanisme pencegahan. Pemeliharaan mekanisme pencegahan.
Proses Pengembangan BCP
8
4. Pengembangan strategi pemulihan layanan Identifikasi metoda pemulihan. Integrasi metoda dalam rancangan
arsitektur TI.
5. Pengembangan rencana penanganan situasi darurat Dokumentasi strategi pemulihan layanan.
Proses Pengembangan BCP
9
6. Uji-coba, pelatihan, dan latihan prosedur darurat Pengembangan target uji-coba dan kriteria
keberhasilan. Perbaikan berdasarkan pengalaman/
permasalahan. Pelatihan personil.
7. Reevaluasi rencana penanggulangan situasi darurat Review dan update.
BCP Policy
10
Terutama berisi:Peran dan tanggung-jawab dalam
organisasi penanggulangan bencanaKepala: koordinator penanggulangan
bencana.Ruang lingkup: bagian dalam organisasi
dan kategori komponen infrastruktur.Kebutuhan sumber daya.Kebutuhan pelatihan personil.Jadwal uji-coba dan latihan.Jadwal reevaluasi rencana penanggulang-an
bencana.
Klasifikasi Insiden
11
Policy juga mengatur insiden apa yang masuk kategori bencana (mengaktifkan BCP).
Menerapkan klasifikasi insiden:1. Negligible (biasa): tidak menyebabkan
kerusakan (listrik mati, aplikasi crash, dsb.)2. Minor (kecil): kerusakan yang tidak
berdampak kerugian.3. Major (besar): kerusakan yang berdampak
kerugian pada bisnis.4. Crisis (krisis): kerusakan yang berdampak
kerugian besar, mengancam kelangsungan bisnis, dan dapat mengganggu sistem lain (pihak ketiga).
Klasifikasi Insiden
Kategori insiden biasanya dikaitkan dengan lamanya gangguan (mulai dari kejadian sampai resolusi):
Kategori Level Lama gangguan Tindakan
Krisis 7 24 jam Aktifkan BCP
6 12 jam Aktifkan BCP
Mayor 5 6 jam Antisipasi BCP
4 4 jam Perbaiki/restorasi
3 2 jam Perbaiki
Minor 2 1 jam Perbaiki
1 0.5 jam Perbaiki
Biasa 0 Catat (log) & monitor
12
Analisa Dampak Bencana
13
Langkah I: Identifikasi sumber daya TI vital:Melibatkan berbagai pihak (user, pengelola
proses bisnis, pengelola aplikasi, dsb.), tahapan:Ranking proses bisnis berdasarkan nilai
strategisnya.Identifikasi komponen infrastruktur yang
mendukung proses-proses bisnis strategis (server, akses ke WAN, dsb.)
Analisa Dampak Bencana
14
Langkah II: Klasifikasi layanan TI berdasarkan toleransi terhadap lamanya gangguan1) Critical: Layanan tidak dapat dijalankan
tanpa fasilitas yang identik, apalagi manual. Biaya interupsi sangat mahal.
2) Vital: Layanan dapat diganti dengan proses manual tapi tidak bisa lama (max. 5 hari).
3) Sensitive: Layanan dapat diganti dengan proses manual dengan biaya yang tidak terlalu tinggi (tambahan staf, dsb.)
4) Non-sensitive: Layanan dapat dihentikan dengan kerugian kecil.
Analisa Dampak Bencana
15
Gangguan pada layanan tidak vital dapat berdampak pada layanan vital.
Toleransi terhadap lamanya gangguan layanan TI dipetakan ke toleransi komponen infrastruktur pendukungnya
Langkah III: Menyusun prioritas (urutan) dalam pemulihan/perbaikan komponen infrastruktur berdasarkan toleransi komponen-komponen infrastruktur vital.
Mekanisme Pencegahan
16
Mekanisme untuk mencegah atau meminimasi gangguan, misal penggunaan:UPS (uninterrupted power supply).Generator set.AC dengan kapasitas berlebih.Fire hydrant atau suppressor.Detektor asap/api.Sensor kelembapan/air.Penyimpanan media tahan api dan kedap air.Tombol emergency shut down.Tempat penyimpanan media off-site.Backup rutin dan sering.
Biaya Pencegahan
17
Tingkat pencegahan yang ideal: minimasi (biaya pencegahan & penanggulangan) + (kerugian akibat gangguan).
Waktu
Bia
ya
Biaya pemulihan/pencegahan
Biaya
ker
ugia
n
akib
at g
angg
uan
minimum
Contoh Biaya vs. Waktu
18
RPO (recovery point objective): target titik waktu dimana transaksi-transaksi terbaru dapat diselamatkan.
RTO (recovery time objective): target waktu pemulihan layanan dari gangguan.
mirroring
diskbackup
tapebackup
1 jam
2 jam
24 jam
gangguan
RTORPO
waktu
Strategi Pemulihan Layanan
19
Penjadwalan backup data dan file penting:Misal metoda child-parent-grand parent
(harian: 7 versi, mingguan: 4 versi, bulanan: 12 versi, tahunan: 1 versi).
Penyimpanan backup di lokasi terpisah, kriteriaTerpisah secara geografis (bebas bencana)Memiliki fasilitas keamanan (access control)Memiliki fasilitas penyimpanan bebas
gangguanBiaya dan waktu untuk mengakses dapat
diterima.
Strategi Pemulihan Layanan
20
Pemulihan layanan di lokasi alternatif/ cadanganMirror (dual) site:
Fasilitas identik dengan replikasi data real-time. Siap mengambil alih setiap saat. Biasanya dimiliki dan dioperasikan oleh perusahaan.
Hot site:Fasilitas cadangan yang dilengkapi dengan
hardware, infrastruktur, dan staf. Proses migrasi sistem dimulai begitu BCP diaktifkan.
Strategi Pemulihan Layanan
21
Warm site:Beberapa sarana sudah tersedia (biasanya
merupakan lokasi layanan lain). Perlu penyiapan untuk mengambil alih layanan.
Cold site:Hanya fasilitas bangunan dengan
infrastruktur dasar (listrik, AC, dsb.) Perlu instalasi peralatan untuk mengambil alih layanan.
Mobile site:Fasilitas portable yang dapat di-setup dimana
saja. Biasanya dimiliki pihak ketiga.
Situs Alternatif
Karakteristik:
Site Cost Hardware Communi-cations
Setup time Location
Cold site Low None None Long Fixed
Warm site
Medium Partial Partial/Full Medium Fixed
Hot site Medium/ High
Full Full Short Fixed
Mobile site
High Dependent Dependent Dependent Not Fixed
Mirror site
High Full Full None Fixed
22
Strategi Pemulihan Layanan
23
Strategi pengadaan perlengkapan penggantiKontrak perjanjian (SLA) dengan
vendor.Termasuk layanan prioritas dalam keadaan
darurat.Beli dan simpan cadangan di gudang.
Investasi besar dan ada resiko teknologi kadaluwarsa.
Kontrak perjanjian dengan pihak ketiga untuk meminjam fasilitas.Fasilitas perusahaan lain dengan teknologi
serupa atau compatible.
Tabulasi Biaya
Biaya (juta Rp)
Strategi Vendor Hardware Software Travel/ Shipping
Labor/ Contractor
Testing Supply
Lokasi Cadangan
Cold site
Warm site
Hot site
Mobile site
Mirror site
Penyimpan-an Offsite
Komersial
Internal
Peralatan Cadangan
SLA
Cadangan
Pinjam
24
Peran dan Tanggung-jawab
Daftar kontak resmi:
25
Dokumen BCP
26