2013-02-15 27 views
5

Gần đây, tôi đã triển khai phần mềm nhận dạng theo kỹ thuật được mô tả trong this paper. Tuy nhiên, tập dữ liệu của tôi cũng chứa các bản đồ độ sâu được chụp bằng OpenNI.Đề xuất cho thuật toán nhận dạng đối tượng sử dụng thông tin chuyên sâu

Tôi muốn tăng cường độ mạnh của trình nhận dạng bằng thông tin chuyên sâu. Tôi mặc dù về đào tạo 1-vs-tất cả các biểu đồ phản ứng nơ cung SVMs sau khi trích xuất các mô tả VFH (tôi đã điều chỉnh giao diện OpenCV DescriptorExtractor cho nhiệm vụ này). Nhưng vấn đề là: làm thế nào tôi có thể kết hợp hai thứ để có được kết quả chính xác hơn? Ai đó có thể gợi ý cho tôi một chiến lược cho điều này?

P.s. Tôi rất muốn kiểm tra trình nhận diện trực tiếp hiển thị các đối tượng cho một kinect (và không, như tôi đang làm ngay bây giờ, cho hình ảnh đã cắt vào trình nhận dạng).

+0

Bạn có chắc chắn sử dụng thông tin sâu sẽ cải thiện mạnh mẽ? Bài báo bạn trích dẫn bằng cách sử dụng SIFT/Bag of Visual Words như một bộ mô tả sẽ dẫn đến một hệ thống bất biến affine, ví dụ: bạn có thể chia tỷ lệ/xoay/dịch đối tượng và nó vẫn sẽ cung cấp cho các mô tả tương tự rộng rãi và do đó nhận ra đối tượng. Nếu bạn sử dụng thông tin chuyên sâu và bắt đầu nghiêng đối tượng ở các góc khác nhau với máy ảnh, bạn sẽ nhận được các tín hiệu khá khác nhau. – jcollomosse

Trả lời

0

Tôi khuyên bạn nên xem PCL, một khung công tác giống như opencv, chỉ dành riêng cho xử lý đám mây điểm. Nó đã được một thời gian kể từ khi sử dụng nó, nhưng các thuật toán là hiện đại khác-of-the-nghệ thuật triển khai.