Chuyển đến nội dung chính

      This content is also available in English.

      Ngày nay, công nghệ là nền tảng cho hầu hết mọi khía cạnh của hoạt động kinh doanh, sự ổn định và liên tục của hệ thống Công nghệ Thông tin ("CNTT") trở thành một yếu tố sống còn trước mọi gián đoạn đột ngột.

      Với sự phổ biến rộng rãi của hệ điều hành Microsoft Windows trong môi trường doanh nghiệp, sự cố ngừng hoạt động hàng loạt do bản cập nhật bảo mật của CrowdStrike đã gây ra những hậu quả nghiêm trọng trên toàn cầu. Bắt đầu xuất hiện ở Úc, sự cố này nhanh chóng lan rộng, ảnh hưởng đến nhiều lĩnh vực quan trọng như tài chính, y tế, vận tải và hàng không.

      Điều đáng chú ý là sự cố này không phải do một cuộc tấn công mạng gây ra, mà lại xuất phát từ một bản vá lỗi phần mềm, nhằm mục đích phát hiện và phân tích các mối đe dọa.

      Và giờ đây nhiều đơn vị đang bắt đầu rà soát lại Quy trình phát triển phần mềm (SDLC) của các đối tác bên thứ ba, cũng như đánh giá lại Kế hoạch kinh doanh liên tục (BCP) của mình.


      Phân tích sự cố

      Các tệp dữ liệu bị lỗi được chạy ở cấp độ của trình điều khiển (driver-level), làm MS Windows bị treo và hiển thị "màn hình xanh chết chóc" (blue screen of death).

      Cách khắc phục đơn giản, chỉ là khởi động máy vào chế độ "Safe mode", xóa các tập tin bị lỗi và khởi động lại lần nữa.

      Tuy nhiên, hầu hết các hệ thống Microsoft hiện nay đều được mã hóa bằng BitLocker và cần nhập mã khôi phục (recovery key), còn các mã này thì rất dài.

      Hậu quả là các quản trị viên hệ thống phải vào từng máy chủ, máy trạm; có trường hợp còn phải mang theo ổ đĩa USB chứa recovery key, di chuyển từ cơ sở này sang cơ sở khác, để lần lượt khôi phục thủ công hệ thống. Quá trình này tốn rất nhiều thời gian và công sức.

      Sự cố này không chỉ đơn thuần là một vấn đề kỹ thuật, mà là một hồi chuông để các doanh nghiệp nhìn nhận một cách nghiêm túc vềtầm quan trọng của việc xây dựng một quy trình SDLC chặt chẽ, cũng như một kế hoạch kinh doanh liên tục một cách toàn diện.


      Lập kế hoạch dự phòng và phục hồi

      Song song với việc khắc phục sự cố cấp bách, các doanh nghiệp cần xây dựng một nền tảng vững chắc cho tương lai bằng cách tích hợp các kế hoạch dự phòng toàn diện. Không chỉ tập trung vào hạ tầng công nghệ thông tin, các kế hoạch này còn phải bao quát các hoạt động kinh doanh cốt lõi, nhằm đảm bảo sự liên tục và ổn định trong mọi tình huống. Bền vững không đồng nghĩa với việc loại bỏ hoàn toàn rủi ro, mà là khả năng thích ứng và phục hồi nhanh chóng trước các sự cố. Các doanh nghiệp cần chuẩn bị sẵn sàng các phương án ứng phó để giảm thiểu tối đa tác động đến hoạt động kinh doanh.

      Mặc dù không thể kiểm soát hoàn toàn các yếu tố bên ngoài, các doanh nghiệp hoàn toàn có thể chủ động tăng cường khả năng sẵn sàng để đối phó với mọi tình huống.

      Kế hoạch sao lưu và phục hồi

      Một chiến lược sao lưu và phục hồi hữu hiệu là thiết yếu đối với các đơn vị, nhằm giảm thiểu tác động từ các sự cố tương tự, bao gồm cả việc đánh giá khả năng khôi phục với quy mô lớn và nhiều áp lực. Các bước quan trọng cần thực hiện như sau:

      1. Xây dựng một chiến lược sao lưu và phục hồi bám sát theo quy mô của tổ chức.


      2. Thực hiện kiểm tra định kỳ để đảm bảo chiến lược sao lưu và phục hồi luôn được bảo trì và cập nhật.


      3. Đánh giá khả năng triển khai chiến lược ở quy mô tương ứng với các mục tiêu khôi phục đã đề ra.


      4. Tích hợp các kịch bản sự cố mất khả năng truy cập vào kế hoạch phục hồi sự cố, bao gồm cả tình huống mất truy cập vật lý, cũng như mất kết nối mạng đối với hệ thống đám mây, và bên thứ ba.


      5. Thực hiện đánh giá tác động định kỳ để hiểu rõ hơn phạm vi ảnh hưởng khi một dịch vụ, ứng dụng cụ thể gặp sự cố hoặc mạng lưới bị xâm nhập.


      6. Rà soát danh sách nhà cung cấp phần mềm và các bên thứ ba quan trọng để tránh phụ thuộc quá mức vào một số ít nhà cung cấp. Đồng thời, thực hiện đánh giá định kỳ về các biện pháp kiểm soát tại các bên thứ ba quan trọng.


      7. Rà soát lại chính sách bảo hiểm (nếu có) liên quan đến các gián đoạn từ bên thứ ba để xác định khả năng giảm thiểu tác động tài chính thông qua bảo hiểm gián đoạn kinh doanh.

      Tầm quan trọng của quản lý rủi ro đối tác thứ ba

      Công tác thẩm định khi lựa chọn và giám sát các nhà cung cấp, đặc biệt là những bên có ảnh hưởng trọng yếu đến cơ sở hạ tầng CNTT cần được thực hiện cẩn thận. Bên cạnh đó, việc chọn lựa các nhà cung cấp có Quy trình phát triển phần mềm (SDLC) và Quản lý thay đổi (change management) nghiêm ngặt cũng là một yêu cầu thiết yếu. Các doanh nghiệp có thể bổ các hoạt động như sau:

      1. Đánh giá rủi ro theo thông lệ: cần duy trì bao quát một danh mục các bên thứ ba; và thực hiện đánh giá đối với các bên thứ ba cung cấp phần mềm nghiệp vụ và dịch vụ kinh doanh. Đánh giá này cần xem xét khả năng doanh nghiệp có thể tiếp tục hoạt động, tình hình tài chính, cách thực hành bảo mật, lịch sử tuân thủ và các sự cố trước đây.
      2. Bảo vệ thông qua hợp đồng: Xác định các Thỏa thuận Mức độ Dịch vụ (SLA) rõ ràng, bao gồm các yêu cầu về hiệu suất, thời gian hoạt động, và chế tài nếu không tuân thủ.
      3. Kiểm toán và giám sát: Thực hiện rà soát thường xuyên các biện pháp kiểm soát của các bên thứ ba, bao gồm kiểm toán định kỳ, xem xét các báo cáo SOC1/SOC2, và duy trì liên lạc thường xuyên với các nhà cung cấp quan trọng để nhanh chóng giải quyết các vấn đề và mối lo ngại. Đặc biệt, cần chú trọng đến quy trình cập nhật và chứng nhận phần mềm, yêu cầu các nhà cung cấp kiểm tra và thẩm định kỹ lưỡng trước khi triển khai bất kỳ cập nhật nào là rất quan trọng.

      KPMG có thể hỗ các doanh nghiệp như thế nào?

      KPMG có thể giúp doanh nghiệp xây dựng một môi trường số an toàn, đáng tin cậy và vững chắc trước những rủi ro và mối đe dọa ngày càng gia tăng.

      pan_tool_alt

      Rà soát và kiểm nghiệm các kế hoạch phục hồi dữ liệu (data recovery) và kinh doanh liên tục (business continuity).


      verified_user

      Rà soát và kiểm nghiệm chiến lực chống chịu trong bảo mật CNTT (cyber resiliency).

      checklist_rtl

      Rà soát chiến lược quản lý chuỗi cung ứng và quản lý rủi ro bên thứ ba.


      groups

      Tăng cường nguồn lực và hỗ trợ khắc phục sự cố CrowdStrike hiện tại.

      reduce_capacity

      Tối ưu hóa hoạt động bảo mật và công nghệ thông qua dịch vụ duy trì nguồn lực thuê ngoài (retainer), giúp doanh nghiệp nhanh chóng ứng phó với các tình huống bảo mật bất ngờ và giảm thiểu thiệt hại.

      Contact us

      Trieu Thi Thu Lan
      Trieu Thi Thu Lan

      Partner, Head of Technology Risk, Technology Consulting Hanoi Market Lead

      KPMG in Vietnam

      ngu thai ngoc khiem
      Ngu Thai Ngoc Khiem

      Director, Technology Consulting

      KPMG in Vietnam

      Download to your devices here

      banner

      Lessons from the CrowdStrike outage (English)

      7 key backup and recovery actions

      banner

      Lessons from the CrowdStrike outage (Vietnamese)

      7 key backup and recovery actions

      The importance of third-party risk management

      The CrowdStrike outage serves as a stark reminder of the need for diligence in selecting and monitoring third-party vendors, especially those critical to IT infrastructure.

      In this case, a breakdown in the SDLC and change management process at CrowdStrike resulted in cascading outages across the globe. Using vendors with rigorous SDLC and change management processes is not optional — it is a necessity.

      Businesses need to intensify their scrutiny of third-party vendors' practices. Specifically, businesses are encouraged to enhance their programs to include:

      • Routine risk assessment: Maintain a broad inventory and perform a risk assessment of third parties involved in the delivery of business software and services to assess their operational viability, financial health, security practices, compliance history, and previous incidents.
      • Contractual protections: Define clear SLAs that outline performance expectations, uptime requirements, and penalties for non-compliance.
      • Regular auditing and monitoring: Perform regular reviews of the controls in place at third parties including periodic audits, reviews of SOC1/SOC2s, and ongoing dialogue with critical vendors to proactively address issues and concerns. Particularly important are the software update and certification processes — requesting that vendors conduct thorough testing and validation before deploying updates is crucial.

      How KPMG can help

      Smart businesses don’t just manage risk, they use it as a source of growth and competitive edge. Technology makes many things possible, but what’s possible isn’t always safe. We can help you create a resilient and trusted digital environment in the face of evolving vulnerabilities and threats. Specifically, we can:

      pan_tool_alt

      Gain access to exclusive market analysis, industry reports, and expert forecasts to make informed investment decisions.


      verified_user

      Review and test your cyber resiliency strategy

      checklist_rtl

      Review your third-party risk management and supply chain management strategy


      groups

      Add scale and assist with CrowdStrike remediation for this current outage

      reduce_capacity

      Add burst capacity through a technology and cyber recovery retainer to improve your ability to manage and mitigate future incidents

      Liên hệ chúng tôi

      Trieu Thi Thu Lan
      Trieu Thi Thu Lan

      Partner, Head of Technology Risk, Technology Consulting Hanoi Market Lead

      KPMG in Vietnam

      ngu thai ngoc khiem
      Ngu Thai Ngoc Khiem

      Director, Technology Consulting

      KPMG in Vietnam

      Tải về máy

      banner

      Hồi chuông cảnh tỉnh từ sự cố CrowdStrike (Tiếng Anh)

      Bài học kinh nghiệm về phục hồi và duy trì hoạt động kinh doanh trong mọi tình huống

      banner

      Hồi chuông cảnh tỉnh từ sự cố CrowdStrike (Tiếng Việt)

      Bài học kinh nghiệm về phục hồi và duy trì hoạt động kinh doanh trong mọi tình huống