Ý tưởng cơ bản
Những ngày này, nhà nước-of-the-art học sâu sắc đối với vấn đề phân loại hình ảnh (ví dụ ImageNet) thường "mạng thần kinh xoắn sâu" (ConvNets Sâu). Họ nhìn gần giống như cấu hình ConvNet này bằng cách Krizhevsky et al: 
Đối với suy luận (phân loại), bạn ăn một hình ảnh vào phía bên trái (lưu ý rằng sâu ở phía bên trái là 3, cho RGB), khủng hoảng thông qua một loạt các bộ lọc convolution, và nó phun ra một vector 1000 chiều ở phía bên tay phải. Bức ảnh này đặc biệt dành cho ImageNet, tập trung vào phân loại 1000 loại hình ảnh, vì vậy vector 1000d là "điểm số của khả năng hình ảnh này phù hợp với danh mục".
Đào tạo lưới thần kinh chỉ phức tạp hơn một chút. Đối với đào tạo, bạn về cơ bản chạy phân loại nhiều lần, và mỗi khi bạn thường xuyên làm backpropagation (xem bài giảng của Andrew Ng) để cải thiện các bộ lọc convolution trong mạng. Về cơ bản, backpropagation hỏi "mạng đã phân loại chính xác/không chính xác là gì? Đối với những thứ bị phân loại sai, hãy sửa lại mạng một chút."
Thực hiện
Caffe là một rất nhanh thực hiện nguồn mở (nhanh hơn cuda-convnet từ Krizhevsky et al) của mạng nơ-ron xoắn sâu. Mã Caffè là khá dễ đọc; về cơ bản có một tệp C++ trên mỗi loại lớp mạng (ví dụ: các lớp co giãn, các lớp kết hợp tối đa, v.v ...).
Xem câu trả lời này trên Xác thực chéo: http://stats.stackexchange.com/a/41201/14673 –
Câu hỏi này thuộc về xác thực chéo http://stats.stackexchange.com/questions/41029/restricted-boltzmann- máy hồi quy/41201 # 41201 – lejlot