Tôi đang sử dụng giao diện Python cho libsvm và những gì tôi nhận thấy là sau khi chọn các thông số C
và gamma
tốt nhất (RBF kernel) bằng tìm kiếm lưới, khi tôi đào tạo mô hình và chéo xác nhận nó (5 lần, nếu nó có liên quan), độ chính xác mà tôi nhận được giống như tỷ lệ nhãn trong tập dữ liệu huấn luyện của tôi.libsvm - Độ chính xác xác thực chéo giống như tỷ lệ nhãn
Tôi có 3947 mẫu và 2898 trong số đó có nhãn -1 và phần còn lại có nhãn 1. Vì vậy, đó là 73.4229% mẫu.
Và khi tôi đào tạo các mô hình và chéo xác nhận nó 5 nếp gấp, đây là những gì tôi nhận được -
optimization finished, #iter = 1529
nu = 0.531517 obj = -209.738688,
rho = 0.997250 nSV = 1847, nBSV = 1534
Total nSV = 1847
Cross Validation Accuracy = 73.4229%
Điều này có nghĩa rằng SVM không tham gia các tính năng vào tài khoản? Hoặc đó là dữ liệu có lỗi ở đây? Cả hai đều có liên quan gì cả? Tôi không thể vượt qua số 73.4229. Ngoài ra, số lượng vectơ hỗ trợ được cho là ít hơn nhiều so với kích thước của tập dữ liệu, nhưng trong trường hợp này, nó không có vẻ như vậy.
Nói chung, ý nghĩa của độ chính xác xác thực chéo giống như tỷ lệ nhãn trong tập dữ liệu là gì?