Tôi thấy mình cần xử lý lưu lượng truy cập mạng được ghi lại với tcpdump
. Đọc lưu lượng truy cập không phải là khó, nhưng những gì được một chút khôn lanh là đốm nơi có "gai" trong giao thông. Tôi chủ yếu quan tâm đến các gói TCP SYN và những gì tôi muốn làm là tìm những ngày có sự gia tăng đột ngột về lưu lượng truy cập cho một cổng đích nhất định. Có khá nhiều dữ liệu để xử lý (khoảng một năm).Thuật toán để phát hiện dị thường ("gai") trong dữ liệu giao thông
Những gì tôi đã thử cho đến nay là sử dụng trung bình di động theo cấp số nhân, điều này đủ tốt để tôi có được một số biện pháp thú vị, nhưng so sánh những gì tôi thấy với các nguồn dữ liệu bên ngoài có vẻ hơi hung hăng trong việc gắn cờ mọi thứ bất thường.
Tôi đã xem xét sử dụng kết hợp trung bình di chuyển theo cấp số nhân cộng với dữ liệu lịch sử (có thể từ 7 ngày trước, nghĩ rằng phải có chu kỳ hàng tuần cho những gì tôi thấy), đọc dường như đã quản lý để mô hình sử dụng tài nguyên theo cách đó với thành công tốt.
Vì vậy, không ai biết về một phương pháp hay hay nơi nào đó để đọc và đọc về loại điều này.
Các đường trung bình động Tôi đã sử dụng vẻ bề ngoài gần như thế:
avg = avg+0.96*(new-avg)
Với avg
là EMA và new
là biện pháp mới. Tôi đã thử nghiệm ngưỡng nào để sử dụng, nhưng thấy rằng sự kết hợp "phải là một yếu tố nhất định cao hơn mức trung bình trước khi cân giá trị mới trong" và "phải cao hơn ít nhất 3" để cho kết quả kém nhất.
Đọc thú vị, chắc chắn. Hiện tại, việc phát hiện mức lưu lượng truy cập tăng là đủ cho những gì tôi cần, nhưng đó chắc chắn là điều cần cân nhắc cho tương lai. – Vatine