Học tập sâu để phân loại hình ảnh

Sau khi đọc một vài bài báo về mạng học sâu và niềm tin sâu sắc, tôi đã có một ý tưởng cơ bản về cách thức hoạt động của nó. Nhưng vẫn còn bị mắc kẹt với bước cuối cùng, tức là bước phân loại. Hầu hết việc triển khai tôi tìm thấy trên giao dịch Internet với thế hệ. (Số MNIST)Học tập sâu để phân loại hình ảnh

Có một số giải thích (hoặc mã) có sẵn ở đâu đó nói về phân loại hình ảnh (tốt nhất là hình ảnh hoặc đối tượng tự nhiên) sử dụng DBN không?

Một số con trỏ theo hướng sẽ thực sự hữu ích.

Nguồn

2013-02-17 Nihar Sarangi

Xem câu trả lời này trên Xác thực chéo: http://stats.stackexchange.com/a/41201/14673 –

Câu hỏi này thuộc về xác thực chéo http://stats.stackexchange.com/questions/41029/restricted-boltzmann- máy hồi quy/41201 # 41201 – lejlot

Bạn nên sử dụng lớp softmax (http://en.wikipedia.org/wiki/Softmax_activation_function) trên mạng bạn đã sử dụng để tạo và sử dụng backpropagation để tinh chỉnh mạng cuối cùng.

Nguồn

2014-01-12 10:07:55 elaRosca

Ý tưởng cơ bản

Những ngày này, nhà nước-of-the-art học sâu sắc đối với vấn đề phân loại hình ảnh (ví dụ ImageNet) thường "mạng thần kinh xoắn sâu" (ConvNets Sâu). Họ nhìn gần giống như cấu hình ConvNet này bằng cách Krizhevsky et al: enter image description here

Đối với suy luận (phân loại), bạn ăn một hình ảnh vào phía bên trái (lưu ý rằng sâu ở phía bên trái là 3, cho RGB), khủng hoảng thông qua một loạt các bộ lọc convolution, và nó phun ra một vector 1000 chiều ở phía bên tay phải. Bức ảnh này đặc biệt dành cho ImageNet, tập trung vào phân loại 1000 loại hình ảnh, vì vậy vector 1000d là "điểm số của khả năng hình ảnh này phù hợp với danh mục".

Đào tạo lưới thần kinh chỉ phức tạp hơn một chút. Đối với đào tạo, bạn về cơ bản chạy phân loại nhiều lần, và mỗi khi bạn thường xuyên làm backpropagation (xem bài giảng của Andrew Ng) để cải thiện các bộ lọc convolution trong mạng. Về cơ bản, backpropagation hỏi "mạng đã phân loại chính xác/không chính xác là gì? Đối với những thứ bị phân loại sai, hãy sửa lại mạng một chút."

Thực hiện

Caffe là một rất nhanh thực hiện nguồn mở (nhanh hơn cuda-convnet từ Krizhevsky et al) của mạng nơ-ron xoắn sâu. Mã Caffè là khá dễ đọc; về cơ bản có một tệp C++ trên mỗi loại lớp mạng (ví dụ: các lớp co giãn, các lớp kết hợp tối đa, v.v ...).

Nguồn

2014-01-16 19:52:11 solvingPuzzles

Những ngày này mọi người bắt đầu sử dụng SVM trong lớp phân loại.

Học tập sâu đang phát triển rất tự do và rộng rãi.

Nguồn

2014-09-12 06:04:46 LazyLearner

Học tập sâu để phân loại hình ảnh

Trả lời

Các vấn đề liên quan