Trả lời 1. Một lớp sẽ mô hình hầu hết các vấn đề hoặc ở tối đa hai lớp có thể được sử dụng.
Trả lời 2. Nếu không sử dụng số nơron không đầy đủ, mạng sẽ không thể lập mô hình dữ liệu phức tạp và kết quả phù hợp sẽ kém. Nếu quá nhiều tế bào thần kinh được sử dụng, thời gian đào tạo có thể trở nên quá dài, và, tệ hơn, mạng có thể phù hợp hơn với dữ liệu. Khi ghi đè $ xảy ra, mạng sẽ bắt đầu tạo ra nhiễu ngẫu nhiên trong dữ liệu. Kết quả là mô hình phù hợp với dữ liệu đào tạo rất tốt, nhưng nó tổng quát kém với dữ liệu mới, không nhìn thấy được. Xác thực phải được sử dụng để kiểm tra điều này.
$ Ghi đè là gì?
Trong thống kê, quá mức xảy ra khi mô hình thống kê mô tả sai số hoặc tiếng ồn ngẫu nhiên thay vì mối quan hệ cơ bản. Tổng quát xảy ra khi một mô hình quá phức tạp, chẳng hạn như có quá nhiều tham số liên quan đến số lượng quan sát. Một mô hình đã được overfit nói chung sẽ có hiệu suất dự đoán kém, vì nó có thể phóng đại dao động nhỏ trong dữ liệu. Khái niệm về overfitting là rất quan trọng trong học máy. Thông thường, một thuật toán học tập được đào tạo bằng cách sử dụng một số ví dụ về đào tạo, ví dụ: các tình huống mẫu mực mà đầu ra mong muốn được biết. Người học được giả định đạt đến một trạng thái mà nó cũng sẽ có thể dự đoán đầu ra chính xác cho các ví dụ khác, do đó khái quát hóa các tình huống không được trình bày trong quá trình đào tạo (dựa trên sự thiên vị quy nạp của nó). Tuy nhiên, đặc biệt là trong trường hợp việc học được thực hiện quá lâu hoặc ví dụ đào tạo hiếm, người học có thể điều chỉnh các tính năng ngẫu nhiên rất cụ thể của dữ liệu đào tạo, không có mối quan hệ nhân quả với chức năng đích. Trong quá trình overfitting này, hiệu suất trên các ví dụ đào tạo vẫn tăng lên trong khi hiệu suất trên dữ liệu vô hình trở nên tồi tệ hơn.
trả lời 3. đọc trả lời 1 & 2.
bài viết Học giám sát trên wikipedia (http://en.wikipedia.org/wiki/Supervised_learning) sẽ cung cấp cho bạn cái nhìn sâu sắc hơn vào các yếu tố là gì mà rất quan trọng đối với bất kỳ hệ thống học tập được giám sát nào bao gồm Netowrks thần kinh. Bài viết nói về Kích thước của không gian đầu vào, số lượng dữ liệu đào tạo, tiếng ồn, vv ..
Có thể trùng lặp của điều này? http://stackoverflow.com/questions/9436209/how-to-choose-number-of-hidden-layers-and-nodes-in-neural-network – Tim
@Tim Nó không nói về "chiều rộng" của lớp và các ưu điểm/nhược điểm của chiều sâu/chiều rộng. –
Trên thực tế, câu trả lời được chấp nhận bao gồm số lượng lớp ẩn (chiều sâu) và số lượng đơn vị ẩn (chiều rộng) – Tim