Tôi gặp sự cố phân loại trong tay, mà tôi muốn giải quyết bằng thuật toán học máy (Bayes hoặc Markovian có thể, câu hỏi độc lập với trình phân loại sẽ được sử dụng) . Với một số trường hợp đào tạo, tôi đang tìm cách để đo lường hiệu suất của một trình phân loại đã được triển khai, với việc xem xét vấn đề overfitting dữ liệu.Đo hiệu suất của thuật toán phân loại
Tức là: cho N [1..100] mẫu đào tạo, nếu tôi chạy thuật toán đào tạo trên mỗi một mẫu và sử dụng các mẫu rất giống nhau này để đo thể lực, nó có thể bị kẹt vào vấn đề overfitting dữ liệu - trình phân loại sẽ biết câu trả lời chính xác cho các trường hợp đào tạo, mà không có nhiều sức mạnh dự đoán, khiến kết quả tập thể dục vô dụng.
Giải pháp rõ ràng sẽ phân tách các mẫu được gắn thẻ tay vào đào tạo và kiểm tra mẫu; và tôi muốn tìm hiểu về các phương pháp chọn các mẫu có ý nghĩa thống kê cho việc đào tạo.
Giấy trắng, con trỏ sách và PDF được đánh giá cao!
http://en.wikipedia.org/wiki/Root-mean-square_error_of_cross-validation#K-fold_cross-validation (liên kết trực tiếp đến xác thực chéo k trong vòng bài viết wiki bạn đã liên kết) – JoeCool