Disaster Recovery (DR) là gì? Cách lập team DR thế nào?

Dc dr là gì

Nghĩa tiếng Việt của nó là “phục hồi sau thảm họa”. DR không phải là một kỹ thuật IT, một công nghệ IT mà đó là một phương pháp được tổ chức có kể hoạch bởi một doanh nghiệp. Một kế hoạch được triển khai nhằm khôi phục dữ liệu bị mất hoặc lấy lại quyền truy cập hệ thống sau những sự cố. Các sự cố xảy ra thường là: thảm họa tự nhiện, sự tấn công của mã độc/hăcker hoặc những sự kiện làm gián đoạn kinh doanh của công ty như đại dịch Covid-19. DR có thể nói là một khía cạnh của quá trình mang tính liên tục trong một tổ chức.

Disaster Recovery (DR) là gì? Cách lập team DR thế nào?

Sơ đồ triển khai kế hoạch DR

Việc chính của khôi phục sau thảm họa dựa vào việc sao chép dữ liệu ở thời điểm gần nhất và khôi phục lại việc xử lý của các Máy Chủ được đặt ở một nơi an toàn nằm ngoài tổ chức. Khi các Máy Chủ trong nội bộ công ty dừng hoạt động vì các nguyên nhân như: thiên tai, hỏa hoạn, hư hỏng thiết bị, sự vô ý của IT hay do sự tấn công của mã độc thì các dữ liệu sẽ gần nhất sẽ được khôi phục cùng với sự hoạt động của một Máy Chủ khác để xử lý thay thế tạm thời cho các Máy Chủ gặp sự cố.

Team DR

Đây là một nhóm những chuyên gia trong công ty. Team DR không chỉ có thành viên IT mà nên có những thành viên liên quan đến các vấn đề quan trọng của Doanh Nghiệp như: tài chính, sản xuất, bán hàng.v.v. Nhóm chuyên gia được phân công này sẽ chịu trách nhiệm quản lý kế hoạch nhằm khắc phục các hậu quả khi một rủi ro xảy ra. Team DR cần phải xác định vai trò và trách nhiệm của từng thành viên trong nhóm. Trong trường hợp xảy ra thảm họa, nhóm DR phải biết cách giao tiếp với nhau, với nhân viên, với nhà cung cấp dịch vụ IT và với các khách hàng của công ty.

Đánh giá rủi ro

Nhóm DR cần thực hiện đánh giá các rủi ro có thể xảy ra đối với công ty. Những yếu tố gây hại nào đối với hệ thống thông tin sẽ khiến việc hoạt động của Doanh nghiệp bị tạm ngưng. Những con số thiệt hại đối với mỗi tình huống. Dự báo các hành động sẽ thực hiện theo từng trường hợp A,B,C… sẽ xảy ra. Cần xác định được các yếu tố rủi ro chính để tập trung quản lý, phòng ngừa và thực hiện sự khôi phục.

Xác định tài sản quan trọng nhất của doanh nghiệp

Một kế hoạch khôi phục sau thảm họa tốt phải bao gồm tài liệu về: hệ thống IT, các ứng dụng IT (applications), dữ liệu (databases) và các tài nguyên khác. Những yếu tố này ảnh hưởng đến tính liên tục của doanh nghiệp, cũng như các bước cần thiết để khôi phục dữ liệu.

Backup database

Bạn cần xác định những cái nào trong hệ thống IT cần backup. Đó có thể là các file databases, các phiên bản của các ứng dụng, các file cấu hình mạng/hệ điều hành.v.v. Ai sẽ là người thực hiện và được thực hiện bằng cách nào. Có 2 yếu tố quan trọng mà hệ thống Backup nào cũng cần phải xem xét đó là: RPO và RTO. RPO là tần suất thực hiện sao lưu như 1 giờ, 1 ngày hay 1 tuần… RTO là khoảng thời gian để thực hiện khôi phục để hệ thống IT trở lại bình thường. RTO có thể tính bằng ngày, phút thậm chí bằng giây. Cái này tùy thuộc vào mô hình kinh doanh của bạn, sự cân nhắc giữa chi phí đầu tư hệ thống Backup và thiệt hại khi hệ thống IT bị ngưng hoạt động.

Kiểm tra và tối ưu hóa

Team DR luôn giám sát và cập nhật các chiến thuật thực hiện backup và khôi phục của mình. Đảm bảo hệ thống thông tin công ty luôn an toàn và có khả năng phục hồi với những “sự cố xấu nhất” có thể xảy ra. Phát hiện ra những mối nguy hiểm tiềm tàng hoặc mới. Luôn cập nhật giải pháp mới để tối ưu hiệu suất, giảm chi phí backup cho Doanh nghiệp. Nhưng luôn đảm bảo hệ thống IT công ty luôn được vận hành liên tục.

Disaster Recovery (DR) là gì? Cách lập team DR thế nào?

Team DR đóng một vai trò quan trọng trong kế hoạch DR của một doanh nghiệp

Việc tạo ra một chiến lược “khôi phục thảm họa” với một kế hoạch tốt sẽ là điều cần thiết với Doanh Nghiệp trong việc phòng ngừa các rủi ro. Chiến lược có thể xuất phát từ một kế hoạch hoàn toàn mới hoặc cải tiến lại một phần của kế hoạch đang vận hành. Việc này luôn cần bắt đầu tại team DR. Team này được thành lập để khai thác tất cả “chuyên môn” của chuyên gia IT và một vài nhân tố quan trọng khác. Team DR cần có đủ quyền hạn, khả năng lãnh đạo và điều phối ở các khía cạnh của Doanh nghiệp như:

Quản trị rủi ro:

Vai trò lãnh đạo này bắt đầu các kế hoạch phục hồi, điều phối các nỗ lực trong suốt quá trình phục hồi và giải quyết các vấn đề hoặc sự chậm trễ xuất hiện

Tính liên tục trong kinh doanh

Chuyên gia giám sát việc này đảm bảo rằng kế hoạch khôi phục phù hợp với nhu cầu kinh doanh của công ty, dựa trên phân tích tác động kinh doanh.

Đánh giá tác động và sự khôi phục

Nhóm chịu trách nhiệm về lĩnh vực khôi phục này có chuyên môn kỹ thuật về cơ sở hạ tầng CNTT bao gồm máy chủ, lưu trữ, cơ sở dữ liệu và mạng.

Các ứng dụng IT

Vai trò này giám sát những hoạt động ứng dụng nào nên được thực hiện dựa trên một kế hoạch phục hồi. Các nhiệm vụ bao gồm tích hợp ứng dụng, cài đặt và cấu hình ứng dụng cũng như tính nhất quán của dữ liệu.

Quản lý và điều hành

Đội ngũ điều hành sẽ cần phê duyệt chiến lược, chính sách và ngân sách liên quan đến kế hoạch khắc phục hậu quả thiên tai, đồng thời cung cấp thông tin đầu vào nếu có trở ngại phát sinh.

Các đơn vị kinh doanh (CBU)

Một đại diện từ mỗi đơn vị kinh doanh sẽ cung cấp thông tin phản hồi một cách lý tưởng về việc lập kế hoạch khắc phục thảm họa để các mối quan tâm cụ thể của họ được giải quyết

Qua bài viết trên, bạn đã hiểu thế nào là DR và biết cách thành lập một team DR sao cho hiệu quả. Việc quản trị rủi ro đúng không phải là cách chúng ta sợ nó, tránh né nó mà bằng việc thừa nhận sự tồn tại của nó. Mỗi rủi ro đều có xác suất xảy ra, việc của Doanh nghiệp là đưa ra một giải pháp phòng ngừa, giảm tác hại của rủi ro. Bên cạnh cần có dữ liệu để khôi phục lại một phần hoặc toàn bộ hệ thống IT khi “sự cố” xảy ra.

Tham khảo: VMWARE