Tôi đã tìm kiếm trên google về vấn đề này và tôi không thể tìm thấy một cái gì đó giải thích thuật toán này một cách đơn giản nhưng chi tiết.Tại sao thuật toán C4.5 sử dụng cắt tỉa để giảm cây quyết định và việc cắt tỉa ảnh hưởng như thế nào đến tính chính xác của dự đoán?
Ví dụ, tôi biết thuật toán id3 không sử dụng cắt tỉa ở tất cả, vì vậy nếu bạn có một đặc tính liên tục, tỷ lệ thành công dự đoán sẽ rất thấp.
Vì vậy, C4.5 để hỗ trợ các đặc điểm liên tục, nó sử dụng cắt tỉa, nhưng đây có phải là lý do duy nhất không?
Ngoài ra tôi thực sự không thể hiểu được trong ứng dụng WEKA, làm thế nào chính xác yếu tố tự tin ảnh hưởng đến hiệu quả của các dự đoán. Yếu tố tin cậy càng nhỏ thì thuật toán cắt tỉa càng nhiều, tuy nhiên mối tương quan giữa việc cắt tỉa và độ chính xác của dự đoán là gì? Bạn càng tỉa, thì dự đoán càng tốt hay tệ hơn thì sao?
Cảm ơn