Chúng tôi có ba trường hợp EC2 — một trong mỗi vùng khả dụng (AZ) ở vùng eu-tây-1. Chúng được loadbalanced bằng ELB. Chúng tôi muốn theo dõi số lượng phiên bản được đăng ký tại loadbalancer, sử dụng CloudWatch. Vấn đề ist: Tôi không thực sự hiểu số liệu HealthyHostCount
.Làm cách nào để sử dụng HealthyHostCount của ELB để theo dõi trong CloudWatch?
Để triển khai, chúng tôi muốn có thể hủy đăng ký một cá thể (lấy nó ra khỏi LB) mà không được thông báo. Vì vậy, báo động sẽ là: Thông báo nếu chỉ có 1 trường hợp khỏe mạnh để lại phía sau loadbalancer trong 5 phút.
Theo như tôi hiểu, HealthyHostCount
(HHC) là số lượng các cá thể khỏe mạnh được đăng ký với ELB nhất định, tính trung bình trên tất cả các AZ. Nếu mọi thứ đều ổn, HHC phải là 1 (bất kể trong khoảng thời gian nào) vì có 1 trường hợp trong mỗi AZ.
Một vài ngày trước, một người nào đó đã triển khai mà không đăng ký lại các phiên bản, vì vậy chỉ có 1 trường hợp được cân bằng. Khi chúng tôi nhận thấy điều đó, chúng tôi đã tạo ra một báo động để thông báo cho chúng tôi khi HHC trung bình chìm dưới 0.6 sau 5 phút. (Nếu chỉ có 1 trường hợp được đăng ký trong ELB, HHC sẽ trung bình 0,33 cho bất kỳ khoảng thời gian nào.) Tuy nhiên, báo thức không bao giờ thay đổi thành trạng thái "ALARM".
Khi tôi kiểm tra HHC trong CloudWatch, HHC là những con số không có ý nghĩa (tổng cộng 10,0 trong khoảng thời gian 5 phút là tất cả những gì tôi nhớ bây giờ).
Đó là một mớ hỗn độn lớn đối với tôi. Bất cứ lúc nào tôi nghĩ rằng tôi hiểu số liệu, các biểu đồ CloudWatch đều vô nghĩa đối với tôi.
Ai đó có thể giải thích cách sử dụng HHC để nhận báo thức khi chỉ có 1 trường hợp được đăng ký? HHC trung bình có phải là con đường để đi hay tôi nên sử dụng một số liệu khác?
Cám ơn lời giải thích chi tiết và tuyệt vời này! –