Tôi gặp vấn đề về ba lớp với dữ liệu không cân bằng (90%, 5%, 5%). Bây giờ tôi muốn đào tạo một trình phân loại bằng LIBSVM.Sử dụng LIBSVM grid.py cho dữ liệu không cân bằng?
Vấn đề là LIBSVM tối ưu hóa gamma tham số và Chi phí cho độ chính xác tối ưu, có nghĩa là 100% các ví dụ được phân loại là lớp 1, tất nhiên không phải là thứ tôi muốn.
Tôi đã thử sửa đổi thông số trọng số -w mà không thành công nhiều.
Vì vậy, những gì tôi muốn là, sửa đổi grid.py theo cách nó tối ưu hóa Chi phí và gamma cho độ chính xác và thu hồi được phân cách bởi các lớp thay vì cho độ chính xác tổng thể. Có cách nào để làm điều đó? Hay có những kịch bản khác ngoài kia có thể làm một cái gì đó như thế này?
cảm ơn, nhưng tôi nghĩ rằng nó phải là cách khác vòng: -w0 5 -w1 90 -w2 90, vì lớp nhỏ hơn nên có thêm chi phí liên kết với chúng .. điều này đã giúp! – Damnum
vâng, tôi nghĩ bạn nói đúng. Tôi vừa chỉnh sửa câu hỏi của mình. Cảm ơn! –
Và khi bạn có nhiều hơn 3 lớp, bạn có thể tính giá trị của mỗi w như thế nào? – lilouch