Tôi bắt đầu sử dụng NaiveBayes/Simple phân loại để phân loại (Weka), tuy nhiên tôi có một số vấn đề cần hiểu khi đào tạo dữ liệu. Tập dữ liệu tôi đang sử dụng là weather.nominal.arff.diễn giải kết quả Naive Bayes
Trong khi tôi sử dụng thử nghiệm đào tạo sử dụng từ các tùy chọn, kết quả phân loại là:
Correctly Classified Instances 13 - 92.8571 %
Incorrectly Classified Instances 1 - 7.1429 %
a b classified as
9 0 a =yes
1 4 b = no
câu hỏi đầu tiên của tôi là những gì tôi nên hiểu từ các trường hợp được phân loại không chính xác? Tại sao một vấn đề như vậy lại xảy ra? bộ sưu tập thuộc tính nào được phân loại không chính xác? có cách nào để hiểu điều này không?
Thứ hai, khi tôi thử xác thực chéo 10 lần, tại sao tôi nhận được các trường hợp được phân loại chính xác khác nhau (ít hơn)?
Kết quả là:
Correctly Classified Instances 8 57.1429 %
Incorrectly Classified Instances 6 42.8571 %
a b <-- classified as
7 2 | a = yes
4 1 | b = no
cảm ơn câu trả lời rõ ràng và mẹo đầu tiên + 1. điểm khó hiểu là thiên vị, ý bạn là gì? Tôi có nên luôn sử dụng xác thực chéo cho tất cả các thuật toán phân loại khác nhau của mình không? – berkay
suy nghĩ về nó, bạn muốn tìm hiểu một mạng lưới Naive Bayes mô hình dữ liệu của bạn, sau đó bạn muốn kiểm tra độ chính xác dự đoán của nó. Nếu bạn đào tạo mô hình và kiểm tra nó trên cùng một tập hợp, thì bạn đang đánh giá quá cao độ chính xác của nó (nó đã thấy những ví dụ cụ thể do đó thực hiện tốt trên chúng), nhưng có lẽ sẽ kém thành công trên dữ liệu mới. Điểm mấu chốt ở đây là ** tổng quát **: chúng tôi muốn khái quát hóa ngoài các trường hợp đã được cung cấp tại "thời gian đào tạo" cho các ví dụ mới không nhìn thấy được. – Amro
Amro cảm ơn câu trả lời rõ ràng. Tôi đang đăng ở đây để đặt câu hỏi về việc thu hồi và độ chính xác của các kết quả xác thực chéo. recall (7/(2 + 7)) = 0778 và độ chính xác là (1/(1 + 4)) = 0.2, tuy nhiên weka nói cho độ chính xác = 0.636? bất kỳ ý tưởng về điều này? – berkay