Tôi đang xây dựng một số mô hình tiên đoán bằng Python và đã sử dụng triển khai SVM của học viên scikits. Nó thực sự tuyệt vời, dễ sử dụng và tương đối nhanh.Triển khai SVM nhanh nhất có thể sử dụng được trong Python
Thật không may, tôi bắt đầu bị ràng buộc bởi thời gian chạy của mình. Tôi chạy SVM rbf trên tập dữ liệu đầy đủ khoảng 4 - 5000 với 650 tính năng. Mỗi lần chạy mất khoảng một phút. Nhưng với xác thực chéo 5 lần + tìm kiếm lưới (bằng cách sử dụng tìm kiếm thô thiển đến tốt), việc này trở nên không khả thi đối với nhiệm vụ của tôi trong tầm tay. Vì vậy, nói chung, mọi người có bất kỳ đề xuất nào về việc triển khai SVM nhanh nhất có thể được sử dụng trong Python không? Điều đó, hoặc bất kỳ cách nào để tăng tốc độ mô hình của tôi?
Tôi đã nghe về việc triển khai GPU của LIBSVM, có vẻ như nó có thể hoạt động. Tôi không biết bất kỳ triển khai SVM GPU nào khác có thể sử dụng được bằng Python, nhưng nó chắc chắn sẽ mở cho người khác. Ngoài ra, không sử dụng GPU tăng đáng kể thời gian chạy?
Tôi cũng nghe nói rằng có nhiều cách xấp xỉ SVM rbf bằng cách sử dụng bản đồ tính năng SVM + tuyến tính trong scikits. Không chắc người ta nghĩ gì về cách tiếp cận này. Một lần nữa, bất cứ ai sử dụng cách tiếp cận này, có phải là một sự gia tăng đáng kể trong thời gian chạy không?
Tất cả ý tưởng để tăng tốc độ của chương trình được chào đón nhiều nhất.
Cảm ơn ogrisel. Tôi sẽ xem xét điều này. Chắc chắn trông thú vị. Sklearn có thể xuất thành định dạng ánh sáng svm? Điều đó chắc chắn sẽ hữu ích. Để đáp ứng với câu trả lời trước của bạn, thật không may, tôi đang đối phó với timeseries, do đó, lấy mẫu ngẫu nhiên + nhổ vào đào tạo/thử nghiệm trở nên khá phức tạp hơn một chút. Không chắc chắn subsampling để đào tạo mô hình của tôi sẽ được tất cả những điều đơn giản. Cảm ơn! – tomas
Xin lỗi, bạn có biết chức năng tiện ích nào trong sklearn có thể xuất ở định dạng ánh sáng SVM không? – tomas
Thực tế nó bị thiếu trong tài liệu nhưng nó ở đó: https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py#L142 – ogrisel