Tôi thấy rằng DecisionTreeClassifier chấp nhận tiêu chí = 'entropy', có nghĩa là nó phải sử dụng thông tin đạt được như là một tiêu chí để tách cây quyết định. Điều tôi cần là tăng thông tin cho từng tính năng ở cấp cơ sở, khi nó sắp tách nút gốc.Làm thế nào để có được thông tin thu được từ một học viên có thể tìm hiểu về DecisionTreeClassifier?
Q
Làm thế nào để có được thông tin thu được từ một học viên có thể tìm hiểu về DecisionTreeClassifier?
11
A
Trả lời
7
Bạn chỉ có thể truy cập thông tin (hoặc tạp chất gini) đối với đối tượng địa lý đã được sử dụng làm nút tách. Thuộc tính DecisionTreeClassifier.tree_.best_error[i]
giữ entropy của nút i-th tách trên tính năng DecisionTreeClassifier.tree_.feature[i]
. Nếu bạn muốn entropy của tất cả các ví dụ tiếp cận nút i-th, hãy xem DecisionTreeClassifier.tree_.init_error[i]
.
Để biết thêm thông tin, xem tài liệu ở đây: https://github.com/scikit-learn/scikit-learn/blob/dacfd8bd5d943cb899ed8cd423aaf11b4f27c186/sklearn/tree/_tree.pyx#L64
Nếu bạn muốn truy cập vào dữ liệu ngẫu nhiên cho mỗi tính năng (tại một nút chia nhất định) - bạn cần phải thay đổi chức năng find_best_split
https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/tree/_tree.pyx#L713
tôi không nhận ra có tài liệu về github. Cảm ơn. –