Disaster Recovery Planning

Jumat, 16 April 2010
Disaster Recovery Planning

Disaster recovery planning adalah suatu pernyataan yang menyeluruh mengenai tindakankonsisten yang harus diambil sebelum, selama, dan setelah suatu peristiwa yang mengganggu yang menyebabkan suatu kerugian penting sumber daya sistem informasi. Disaster recovery plan adalah prosedur untuk merespons suatu keadaan darurat, menyediakan backup operasi selama gangguan terjadi, dan mengelola pemulihan dan menyelamatkan proses sesudahnya. Sasaran pokok disaster recover plan adalah untuk menyediakan kemampuan dalam menerapkan proses kritis di lokasi lain dan mengembalikannya ke lokasi dan kondisi semula dalam suatu batasan waktu yang memperkecil kerugian kepada organisasi, dengan pelaksanaan prosedur recovery yang cepat.

Tujuan dan Sasaran DRP :

Tujuan DRP yang utama adalah untuk menyediakan suatu cara yang terorganisir untuk membuat keputusan jika suatu peristiwa yang mengganggu terjadi. Tujuan disaster recovery plan adalah untuk mengurangi kebingungan organisasi dan meningkatkan kemampuan organisasi untuk berhubungan dengan krisis tersebut.
Sesungguhnya, ketika suatu peristiwa yang mengganggu terjadi, organisasi tidak akan mempunyai kemampuan untuk menciptakan dan melaksanakan suatu rencana pemulihan dengan segera. Oleh karena itu, jumlah perencanaan dan pengujian yang telah dilakukan sebelumnya akan menentukan kemampuan organisasi tersebut dalam mengangani suatu bencana.

DRP mempunyai banyak sasaran, dan masing-masing sasaran tersebut penting. Sasaran-sasaran tersebut meliputi:
 Melindungi suatu organisasi dari kegagalan penyediaan jasa komputer.
 Memperkecil risiko keterlambatan suatu organisasi dalam menyediakan jasa
 Menjamin keandalan sistem melalui pengujian dan simulasi
 Memperkecil pengambilan keputusan oleh personil selama suatu bencana.

Tahapan DRP ini meliputi:
 Proses DRP
 Pengujian disaster recovery plan
 Prosedur disaster recovery

Proses Disaster Recovery Planning
Tahap ini meliputi mengembangan dan pembuatan rencana recovery yang mirip dengan proses BCP. Di sini, kita mengasumsikan bahwa identifikasi itu telah dibuat dan dasar pemikiran telah diciptakan. Sekarang kita tinggal menentukan langkah-langkah yang harus kita lakukan untuk melindungi bisnis itu ketika bencana yang sebenarnya terjadi.

Langkah-Langkah di dalam tahap disaster planning process adalah sebagai berikut:
 Data Processing Continuity Planning. Perencanaan ketika terjadi bencana dan menciptakan rencana untuk mengatasi bencana tersebut.
 Disaster Recovery Plan Maintenance. Melihara rencana tersebut agar selalu diperbarui dan relevan.
1. Data Processing Continuity Planning
Berbagai cara proses backup adalah unsur-unsur terpenting dalam disaster recovery plan. Di bawah ini dapat lihat jenis-jenis proses yang paling umum:
 Mutual aid agreements
 Subcription services
 Multiple centers
 Service bureaus
 Data center backup alternatif lainnya.

a. Mutual Aid Agreements
Mutual aid agreements adalah suatu perjanjian dengan perusahaan lain yang mungkin punya kebutuhan komputasi serupa. Perusahaan lain mungkin punya bentuk wujud perangkat lunak atau perangkat keras serupa, atau memerlukan komunikasi data jaringan yang sama atau akses internet yang serupa dengan organisasi milik kita.
Di dalam persetujuan ini, kedua belah pihak setuju untuk mendukung satu sama lain ketika suatu peristiwa yang mengganggu terjadi. Persetujuan ini dibuat dengan asumsi bahwa masingmasing operasi organisasi mempunyai kapasitas untuk mendukung operasi organisasi lain yang sejenis pada saat diperlukan.
Ada keuntungan yang jelas dari perjanjian ini. Hal ini memungkinkan suatu organisasi untuk memperoleh tempat sementara untuk melakukan kegiatan operasionalnya ketika terjadi bencana dengan biaya yang sangat kecil atau tanpa biaya sama sekali. Juga, jika perusahaan mempunyai kebutuhan proses yang serupa, seperti sistem operasi jaringan yang sama, kebutuhan komunikasi data yang sama, atau prosedur proses transaksi yang sama prosedur, persetujuan jenis ini mungkin tepat dan dapat dilakukan.
Persetujuan jenis ini mempunyai kerugian serius pula, bagaimanapun, dan benar-benar harus dipertimbangkan hanya jika organisasi mempunyai mitra yang sempurna dan tidak punya alternatif lain terhadap disaster recovery. Satu kerugiannya adalah mau tidak mau masing-masing infrastruktur organisasi harus mempunyai ekstra kapasitas yang tak terpakai untuk memungkinkan pengolahan operasional penuh sepanjang peristiwa yang mengganggu terjadi.
Kekurangan yang paling besar dalam rencana jenis ini adalah apa yang akan terjadi ketika bencana tersebut cukup besar dan mempengaruhi kedua organisasi tersebut. Ketika keduanya mengalami bencana, keuntungan yang sedianya bisa diperoleh menjadi tidak lagi dimungkinkan.



b. Subscription Services
Jenis skenario lain yaitu dengan menggunakan jasa langganan (subcription services). Di dalam skenario ini, pihak ketiga, jasa komersial menyediakan proses backup dan fasilitas pemrosesannya. Jasa Langganan mungkin yang paling umum dilakukan. Jenis ini mempunyai kerugian dan keuntungan yang sangat spesifik.
Terdapat tiga bentuk dasar subcription service dengan beberapa variasi:
• Hot Site
Ini adalah lokasi backup alternatif yang paling hebat. Hot site adalah suatu tempat yang mempunyai fasilitas komputer yang dipasok dengan daya listrik, pemanasan, ventilasi, dan proses pengaturan suhu, dan berfungsi sebagai file/print server dan workstation. Aplikasi yang diperlukan untuk mendukung proses transaksi secara remote di-install pada server dan workstation dan dijaga agar selalu up-to-date sesuai dengan kondisi operasional biasa. Lokasi jenis ini memerlukan pemeliharaan perangkat keras, perangkat lunak, data, dan aplikasi yang teratur untuk menjaga kesesuaian dengan kondisi biasanya. Hal ini memerlukan biaya administratif yang lebih dan cukup menghabiskan sumber daya.
Keuntungan dari hot site ini cukup banyak. Keuntungan yang utama adalah bahwa ketersediannya selama 24/7. Hot site dapat digunakan secara cepat dan tersedia (atau di dalam toleransi waktu yang diperbolehkan) sesaat setelah peristiwa yang mengganggu terjadi.

• Warm Site
Warm site merupakan kombinasi antara hot site dan cold site. Seperti halnya hot site, pada warm site terdapat suatu fasilitas komputer yang tersedia dengan daya listrik dan HVAC, tetapi aplikasinya belum di-install atau dikonfigurasi. Untuk memungkinkan pengolahan secara remote pada lokasi jenis ini, workstation harus dikirimkan dengan cepat; dan aplikasi dan data mereka perlu di-restore dari backup media. Keuntungan warm site adalah sebagai berikut: Harga. Lebih murah dibanding hot site. Lokasi. Lokasi bisa dipilih lebih fleksibel. Sumber daya. Sumber daya yang digunakan lebih sedikit daripada sumber daya yang dibutuhkan hot site. Kerugian yang utama dibandingkan dengan hot site, adalah diperlukannya waktu dan usaha yang lebih besar untuk memulai proses recovery di tempat yang baru. Jika proses operasional
transaksi tidak begitu penting dan kritis, warm site dapat menjadi pilihan yang tepat.

• Cold Site
Cold site merupakan pilihan paling tidak siap dari ketiga pilihan yang ada, tetapi mungkin yang paling umum. Cold site berbeda dengan dua yang lain, cold site merupakan suatu ruang dengan daya listrik dan HVAC, tetapi komputer harus dibawa dari luar jika diperlukan, dan link komunikasi bisa ada ataupun tidak. File/print server harus dibawa masuk, seperti halnya semua workstation, dan aplikasi perlu diinstall dan data di-resore dari backup.
Ada beberapa keuntungan cold site, bagaimanapun, yang menjadi alasan utama adalah biaya. Jika suatu organisasi mempunyai anggaran sangat kecil untuk suatu lokasi proses backup alternatif, cold site mungkin lebih baik dibanding tidak ada sama sekali.

b. Multiple Centers
Variasi untuk lokasi alternatif yang sebelumnya telah disebutkan sebelumnya dinamakan multiple centers, atau lokasi rangkap. Dalam suatu konsep multiple-center, proses pengolahan tersebar di beberapa pusat operasi, menciptakan suatu pendekatan reduncancy dan pembagian sumber daya tersedia. Multiple-center ini dimiliki dan diatur oleh organisasi yang sama (lokasi in-house) atau penggunaan bersama dengan beberapa macam persetujuan timbal balik. Keuntungannya terutama hanya semata-mata masalah finansial. Kerugian yang utama adalah relatif lebih sulit untuk dikelola.


c. Service Bureaus
Dalam kasus yang langka, suatu organisasi dapat mengontrak suatu kantor jasa/layanan untuk secara penuh menyediakan semua proses backup. Keuntungan yang besar pada jenis ini adalah ketersediaan dan tanggapan yang cepat kantor jasa/layanan dan uji coba bisa dilakukan.Kerugian dari jenis ini adalah biaya yang dibutuhkan cukup besar.
2. Disaster Recovery Plan Maintenance
Disaster Recovery Plan sering kali kadaluarsa. Perusahaan dapat menyusun kembali DRP-nya, bisnis unit yang kritis mungkin berbeda dibanding ketika rencana yang yang pertama diciptakan. Yang paling umum adalah berubahnya infrastruktur jaringan atau infrastruktur komputasi berubah (perangkat keras, perangkat lunak, dan lain komponennya). Pertimbangan boleh jadi administratif: DRP yang kompleks tidaklah dengan mudah dibaharui, personil kehilangan minat, atau terjadinya pergantian karyawan yang mempengaruhi keterlibatannya.
Apapun alasannya, merencanakan teknik pemeliharaan harus dimulai sejak dari permulaan untuk memastikan bahwa rencana tersebut selalu up-to-date dan dapat dipakai. Adalah penting untuk membangun prosedur pengelolaan ke dalam organisasi dengan memasukkannya ke dalam job description masing-masing staf yang memusatkan tanggung jawab untuk selalu diperbaharui. Juga, menciptakan prosedur audit yang dapat melaporkan secara teratur atas status rencana tersebut. Adalah juga penting memastikan bahwa tidak ada versi yang ganda atas rencana tersebut, sebab hal tersebut bisa menciptakan kebingungan ketika terjadi suatu keadaan darurat.
Lima Jenis Tes Disaster Recovery Plan :
Ada 5 tipe tes rencana pemulihan bencana. Susunan di bawah ini adalah berdasarkan prioritas,dari yang paling sederhana hingga jenis/tipe tes yang paling lengkap.Setiap tes terlibat secara lebih progresif dan lebih akurat melukiskan tanggung jawab actual perusahaan. Beberapa tipe-tipe tes, contohnya dua yang terakhir memerlukan investasi besarbaik waktu, sumber daya dan koordinasi saat implementasi.
Berikut ini adalah jenis/tipe tes :
 Checklist Test. Duplikasi dari rencana tersebut didistribusikan ke masing-masing business units management. Rencana tersebut kemudian di-review untuk menjamin rencana tersebut terhubungkan kesemua prosedur-prosedur dan area-area organisasi yang critical. Kenyataannya, ini dianggap sesuatu langkah pendahuluan tes yang nyata dan bukan tes yang memuaskan.
 Simulation Test. Selama tes simulasi, seluruh personil operasional dan support diharapkan menjalankan actual emergency meet pada sesi latihan. Tujuannya di sini adalah untuk menguji kemampuan personil dalam merespons simulasi bencana. Simulasi tersebut mengarah pada point relokasi untuk alternatif backup site atau menentukan prosedur pemulihan, tetapi tidakdilaksanakan proses pemulihan aktual atau proses alternatif.
 Paralel Test. Paralel adalah tes penuh dari rencana recovery, dengan menggunakan seluruh personil. Perbedaan antara paralel test dengan full interruption test selanjutnya adalah proses produksi utama pada bisnis tidak berhenti. Tujuan dari tes jenis ini adalah untuk memastikan bahwa critical system akan berjalan aktual pada alternatif proses backup site. Sistem-sistem tersebut direlokasikan ke site alternatif , proses paralel mulai dijalankan dan hasil transaksitransaksi dan elemen-elemen lainnya yang dibandingkan. Tipe ini yang paling umum dari tes disaster recovery plan.
 Full – Interruption Test. Selama full interruption test, sesuatu bencana direplikasikan langsung ke sesuatu saat pelaksanaan produksi normal yang terhenti. Rencana tersebut secara keseluruhan di implementasikan seperti sebuah bencana yang nyata, langsung melibatkan emergency sevices (meskipun untuk tes yang lebih besar, local authorities mungkin di informasikan dan membantu cordinate). Tes tersebut merupakan bentuk tes yang sangat menakutkan, dari mana ini dapat menyebabkan sesuatu bencana pada tes tersebut. Ini juga merupakan jalan yang terbaik yang paling pasti untuk menguji disaster recovery plan.

Tahapan Disaster Recovery Plan adalah sebagai berikut :
1. REDUNDANT atau Dual Input POWER SOURCE
Siapkan power source yang memadai dan siap pakai serta bisa juga kita terapkan pada DUAL Input power ke UPS kita. Jika tidak ada Genset, kita juga bisa memanfaatkan Input sumber daya yang lain seperti tenaga Surya, dll.
a. Input Power dari PLN.
b. Input Power dari GENSET.
c. Input Power dari Power Source lain.
2. DUAL UPS atau Redundant UPS to PSU
a. UPS A
b. UPS B
Kita gunakan 2 UPS dengan Input Power Source yang berbeda untuk men-supply sebuah server yang memiliki dual Power Supply Unit. Tentunya ini berlaku untuk server yang punya 2 buah Power Supply Unit ( PSU ). Tujuannya adalah jika terjadi problem di salah satu Power Source maka Server juga masih bisa hidup dari Power Supply yang lain atau Power Source yang lain.
3. DUAL POWER SUPPLY UNIT ( per server )
a. PSU A dengan power input dari UPS A
b. PSU B dengan power input dari UPS B
Tidak semua Server memiliki fasilitas Dual Power Supply ini, jadi jika server kita memiliki dual Power Supply maka sebaiknya kita manfaatkan se-optimal mungkin.

4. LOCAL STORAGE RAID System untuk OS
RAID System ( Redundant Array of Inexpensive Disks ) adalah sekelompok harddisk yang berfungsi saling mengantikan / redundant untuk menjaga fungsional harddisk.

Tujuannya adalah jika salah satu atau beberapa harddisk dari suatu kelompok harddisk mengalami kerusakan, maka sekelompok harddisk tersebut secara fungsi tidak mengalami problem sehingga kita tidak sampai mengalami kehilangan data. Pada RAID System ini dianjurkan mengunakan harddisk HotPlug atau harddisk HotSwap, sehingga dengan harddisk ini kita tidak perlu mematikan server untuk proses pengantian harddisk yang rusak tersebut.System RAID yang dapat kita gunakan adalah :
a. RAID 1+0 / Mirror ( minimal ), lebih bagus lagi pake RAID5 atau RAID6 .
b. RAID5 => ( N=N-1 ), 1 buah harddisk yang dialokasikan untuk Fault Tolerance.
c. RAID6 / RAID ADG ( Advanced Data Guard ) => ( N=N-2 ), 2 buah harddisk yang dialokasikan untuk Fault Tolerance.
5. DUAL / REDUNDANT Connection LAN per server
Mengunakan 2 LAN Card atau lebih tentu akan menjamin Availability server dalam jaringan jika terjadi kerusakan pada LAN Card Server. Sehingga jika salah satu koneksi LAN putus maka koneksi LAN yang lain dapat mengambil alih koneksi atau otomatis Take Over. Redundant Connection ini dapat berupa :
a. NIC / LAN Card untuk Redundant Connection & Load Balancing
b. FO untuk Redundant Connection (Server ke SAN / NAS & FO antar Switch)

6. REDUNDANT Connection EXTERNAL STORAGE
Protection untuk OS, Database & Fileserver External Storage berupa SAN ( Storage Area Network ) ataupun NAS ( Network Attach Storage ) saat ini sudah menjadi suatu kebutuhan pokok dalam Server System. Redundant Connection dari Server ke External Storage ini sangat penting karena sangat membantu dalam menigkatkan proteksi storage sesuai sehingga fungsional Data Storage dapat befungsi sebagaimana mestinya. Koneksi dari Server ke External Storage berupa Fiber Optic ( FO ) atau Ethernet Connection ( iSCSI ) dan proteksi ke storage kita berupa :
a. System RAID (RAID 1+0, RAID5 atau RAID6)
b. ASM & OMF ( khusus untuk Database Oracle )

7. TAPE BACKUP, Tape Library atau Vitual Tape Library ( VTL )
Tape Backup adalah Proteksi Data lebih lanjut baik ke External Catriedge maupun Virtual Tape Library yang selanjutnya Tape Catriedge di simpan ke suatu tempat khusus agar jika terjadi disaster ( musibah ) dapat digunakan untuk recovery data dengan cepat.
a. Tape Backup Convensional dengan Catriedge yang memadai
b. FO untuk Redundant Connection (dari Server ke Library atau VTL / Virtual Tape library)
8. SERVER REPLICATION TECHNOLOGY
Technology yang di implementasikan pada Server kita sangat berperan penting, misalnya pada Single Server jika terjadi problem ringan seperti RESTART Server, Update Patch, dll butuh waktu untuk Downtime 5 menit hingga 15 menit untuk proses Running Up Server. Apalagi problem fatal maka butuh waktu sekitar 1 jam lebih untuk Re-Building Server yang sama seperti semula. Maka dengan Technology Server Replication maka Downtime Server tersebut bisa di minimalkan bahkan bisa di tekan hingga hingga ZERO Downtime.
Ada 2 macam teknik dalam Server Replication, yaitu :
a. MIRRORED SERVER
b. CLUSTERED SERVER
Pada Mirrored server dibutuhkan Intervensi IT Administrator untuk melakukan Switching atau TakeOver Server termasuk menjalankan Script agar Server Pasif dapat mengambil alih Server Aktif yang sedang Down. Sedangkan pada Clustered Server tidak lagi dibutuhkan intervensi IT Administrator karena Clustered Server bisa melakukan TakeOver secara otomatis. Pada server penulis, proses TakeOver Clustered Server dari NODE1 ke NODE2 di Windows Server 2003 hanya berjalan dalam hitungan sekitar 5 detik.

Clustered System adalah Teknik mengabungkan kemampuan atau kekuatan beberapa buah Server menjadi sebuah Server System yang Powerfull. Secara phisical, Clustered Server ini terdiri atas 2 buah Server atau lebih bahkan hingga ratusan Server. Namun secara System dikenali sebagai 1 buah Server System. Jadi Clustered Server merupakan manifestasi atau miniatur daripada Server Mainframe yang harganya sangat mahal, sehingga dengan menjadi Clustered Server biaya pembelian Server Mainframe dapat di gantikan dengan membangun Clustered Server.
9. SERVER CO-LOCATION
Server Colocation adalah Server production kita gunakan operasional sehari-hari yang di Replikasi-kan pada Server kita yang berada diluar Site Server kita. Misalnya di luar kota, di luar pulau bahkan di luar negeri. Implementasi ini sangat bergantung pada kecepatan bandwith koneksi yang kita miliki atau kita sewa dari ISP.
Ada 3 macam teknik dalam Server Co-Location, yaitu :
a. MIRRORED SERVER Co-Location
b. CLUSTERED SERVER Co-Location
c. BACKUP Storage to Co-Location Storage ( umumnya mengunakan NAS dengan iSCSI )

0 komentar:

Posting Komentar