Tôi đã đọc kỹ tài liệu CARET tại: http://caret.r-forge.r-project.org/training.html, họa tiết và mọi thứ khá rõ ràng (ví dụ trên trang web trợ giúp rất nhiều!), Nhưng tôi vẫn còn bối rối về mối quan hệ giữa hai lập luận để trainControl
:CARET. Mối quan hệ giữa tách dữ liệu và đào tạoKiểm soát
method
index
và hưởng lẫn nhau giữa trainControl
và tách dữ liệu chức năng trong dấu nháy (ví dụ createDataPartition
, createResample
, createFolds
và createMultiFolds
)
để khung tốt hơn của tôi câu hỏi, hãy để tôi sử dụng ví dụ sau đây từ các tài liệu:
data(BloodBrain)
set.seed(1)
tmp <- createDataPartition(logBBB,p = .8, times = 100)
trControl = trainControl(method = "LGOCV", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
Câu hỏi của tôi là:
Nếu tôi sử dụng
createDataPartition
(mà tôi cho rằng không phân tầng bootstrapping), như trong ví dụ trên, và tôi chuyển kết quả làindex
đếntrainControl
tôi có cần sử dụngLGOCV
làm phương thức trong cuộc gọi của tôitrainControl
không? Nếu tôi sử dụng một số khác (ví dụ:cv
) Điều gì sẽ khác biệt? Trong đầu của tôi, khi bạn sửa lỗiindex
, về cơ bản bạn chọn loại xác thực chéo, vì vậy tôi không chắc chắn vai trò nàomethod
phát nếu bạn sử dụngindex
.Sự khác nhau giữa
createDataPartition
vàcreateResample
là gì? Có phải làcreateDataPartition
không phân tầng bootstrapping, trong khicreateResample
thì không?
3) Làm thế nào tôi có thể làm phân tầng k lần (ví dụ: 10 lần) cross validation sử dụng dấu nháy? Sau đây sẽ làm điều đó?
tmp <- createFolds(logBBB, k=10, list=TRUE, times = 100)
trControl = trainControl(method = "cv", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
Thú vị. Cảm ơn! Tôi đang gặp khó khăn khi lập bản đồ câu trả lời cho câu hỏi của tôi. Dựa trên điều này, bạn nghĩ 'chỉ số' đóng vai trò gì ở đây? –
@ user273158 bạn có ý nghĩa gì với vai trò của chỉ mục? chỉ là chỉ bạn tmp vector ... phân vùng của bạn .. – agstudy
Hmm, nhưng làm thế nào một phương pháp như 'boot' (bootstrapping) sử dụng các phân vùng được chỉ định trong' index'? Tôi hiểu bootstrapping như một phương thức cho CV (mẫu có thay thế để đào tạo và đánh giá về những gì còn lại), nhưng không phải cách 'index' được sử dụng trong bootstrapping. –