Cloudflare là một giải pháp đám mây khổng lồ, giúp các cá nhân và doanh nghiệp quản lý hơn 3 triệu lưu lượng truy cập nhờ vào các sản phẩm có tính toàn diện của mình.

Mọi thứ đều rất ổn cho đến ngày 02/07 vừa qua, lỗi "502 Bad Gateway" xuất hiện ngập tràn trên các website và ứng dụng web khiến rất nhiều người bị ảnh hưởng.

Cloudflare thông báo rằng, họ đã phải trải qua một sự cố nghiêm trọng về tài nguyên, khiến nhiều trang web rơi vào trạng thái tê liệt và ảnh hưởng tới người dùng. Họ thừa nhận, vấn đề này đã xảy ra trên toàn thế giới và đang tiến hành khắc phục ngay sau khi sự cố xảy ra.

VNIS đã phát hiện ra sự cố ngừng hoạt động của Cloudflare trên bảng điều khiển phân tích của mình

Bảng phân tích cho thấy, vấn đề của Cloudflare gặp phải là từ việc "triển khai phần mềm lỗi". Hiện, tất cả các dịch vụ đã trở lại hoạt động bình thường sau khi được khôi phục.


Giấc mơ được báo trước từ AWS

Cùng quay trở lại năm 2017, AWS cũng đã gặp một vấn đề tương tự như Cloudflare. Như bạn có thể đã biết, hầu hết các trang web và ứng dụng web đều lưu trữ dịch vụ của họ trên AWS. AWS S3 đã gặp phải vấn đề và phải ngoại tuyến trong 4 giờ đồng hồ. Sự cố này chắc chắn đã gây ra một sự hoảng loạn lớn cho tất cả cư dân mạng.

Nguồn: http://blog.catchpoint.com/2017/03/01/aws-s3-outage-impact/

Sự cố này đã lặp lại quá khứ một lần nữa. Khi lựa chọn nhà cung cấp các giải pháp đám mây, chúng ta thường quên đi tầm quan trọng của nguồn tài nguyên dự phòng. Không phải vì nó không quan trọng, mà là bởi sự chủ quan của chúng ta khi nghĩ rằng, các nhà cung cấp giải pháp đám mây lớn sẽ không bao giờ gặp vấn đề gì cả. Và do đó, các doanh nghiệp không có nguồn tài nguyên dự phòng sẽ phải trả giá.

Có vẻ như chúng ta vẫn chưa học được bài học nào.


Nếu như "một" là chưa đủ, thì phải dùng "nhiều hơn một"

"Multi-Cloud" bỗng trở nên nổi tiếng trong những năm gần đây, thế nhưng nó vẫn chưa thực sự được quan tâm. Tuy nhiên, khi nói đến việc quản lý sự cố mất tài nguyên thì Multi Cloud lại là giải pháp tốt nhất. Trước đó, VNIS đã đề cập đến vấn đề này. Bạn có thể tìm đọc lại bài blog này tại đây.

Đây là một ý tưởng kết hợp nhiều cơ sở hạ tầng công cộng dưới dạng một môi trường dịch vụ (IaaS), như là Microsoft Azure, Amazon Web Services hay Google Cloud. Tất cả đều hoạt động như một phần của một kiến trúc không đồng nhất (còn gọi là chiến lược đám mây Polynimbus). Với mô hình này, bạn không còn phải dựa vào một môi trường đám mây duy nhất để duy trì hoạt động nữa.

VNIS đã phát triển công nghệ Multi CDN và hoàn thiện nó trong nhiều năm. Multi CDN là sự kết hợp nhiều CDN lại với nhau và cho phép khách hàng của chúng tôi sử dụng nó như khi họ chỉ sử dụng một CDN. Chúng tôi cũng đã xây dựng nền tảng này với hệ thống AI để mang lại cho website người dùng CDN tốt nhất và tránh triệt để tình trạng ngừng hoạt động.

Nền tảng này đã giúp người dùng của chúng tôi luôn được an toàn qua bao lần internet ngừng hoạt động, bao gồm cả sự cố nghiêm trọng của Cloudflare xảy ra ngày 02/07/2019 hôm qua.