2012-11-05 61 views
6

Tôi đang sử dụng thuật toán rừng ngẫu nhiên làm trình phân loại dự án luận án của mình. Bộ đào tạo bao gồm hàng nghìn hình ảnh và mỗi hình ảnh về 2000 pixel được lấy mẫu. Đối với mỗi pixel, tôi có hàng trăm nghìn tính năng. Với giới hạn phần cứng hiện tại của tôi (8G ram, có thể mở rộng đến 16G), tôi có thể để vừa với các mẫu (ví dụ: tính năng trên mỗi pixel) chỉ cho một hình ảnh. Câu hỏi của tôi là: có thể gọi nhiều lần phương thức đào tạo, mỗi lần với các mẫu hình ảnh khác nhau và tự động nhận được mô hình thống kê cập nhật tại mỗi cuộc gọi không? Tôi đặc biệt quan tâm đến tầm quan trọng biến kể từ sau khi tôi đào tạo tập huấn đầy đủ với toàn bộ tính năng được đặt, ý tưởng của tôi là giảm số lượng các tính năng từ hàng trăm nghìn đến khoảng 2000, chỉ giữ .OpenCV Đào tạo rừng ngẫu nhiên lặp lại

Cảm ơn bạn cho bất kỳ lời khuyên, Daniele

Trả lời

2

Tôi không nghĩ rằng các thuật toán hỗ trợ đào tạo gia tăng. Bạn có thể xem xét giảm kích thước của các mô tả của bạn trước khi đào tạo, bằng cách sử dụng phương pháp giảm tính năng khác. Hoặc ước tính tầm quan trọng biến trên một tập hợp con ngẫu nhiên của các điểm ảnh được chụp trong tất cả các hình ảnh đào tạo của bạn, nhiều như bạn có thể đưa vào bộ nhớ của bạn ...

0

Xem câu trả lời của tôi cho this post. Có các phiên bản gia tăng của các khu rừng ngẫu nhiên và chúng sẽ cho phép bạn đào tạo trên dữ liệu lớn hơn nhiều.

+1

Rất tiếc, tôi đã đọc câu trả lời của bạn quá muộn. Tôi kết thúc với một thực hiện tùy chỉnh bằng cách nào đó tương tự như của bạn (cây tăng trưởng một cách hơi thở đầu tiên). Hơn nữa, sự tăng trưởng được thực hiện trên mỗi nút và song song bằng cách sử dụng OpenCL. Tất cả mã đều có tại đây http://code.google.com/p/parloma/source/browse/#svn%2Ftrunk%2Frandom_forest_gpu. Mã bây giờ là cụ thể cho vấn đề của tôi (nhận dạng tay), hy vọng sẽ tìm ra thời gian để viết lại thư viện để xử lý các vấn đề chung. – mUogoro

+0

Một thực hiện mục đích chung hơn có thể được tìm thấy ở đây https://github.com/mUogoro/padenti – mUogoro