Tôi đang thực hiện hồi quy logistic bằng cách sử dụng page này. Mã của tôi như sau.R khu vực hồi quy logistic dưới đường cong
mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
mylogit <- glm(admit ~ gre, data = mydata, family = "binomial")
summary(mylogit)
prob=predict(mylogit,type=c("response"))
mydata$prob=prob
Sau khi chạy mã này mydata dataframe có hai cột - 'thừa nhận' và 'prob'. Hai cột đó có đủ để có được đường cong ROC không?
Tôi có thể lấy đường cong ROC như thế nào.
Thứ hai, bằng cách nới lỏng tại mydata, có vẻ như mô hình dự đoán tính xác thực của admit=1
.
Điều đó có đúng không?
Làm cách nào để tìm ra sự kiện cụ thể mà mô hình dự đoán?
Cảm ơn
UPDATE: Dường như bên dưới ba lệnh rất hữu ích. Họ cung cấp các cut-off mà sẽ có độ chính xác tối đa và sau đó giúp đỡ để có được đường cong ROC.
coords(g, "best")
mydata$prediction=ifelse(prob>=0.3126844,1,0)
confusionMatrix(mydata$prediction,mydata$admit
Nó sẽ không thể rất đơn giản để kiểm tra chắc chắn bạn về những gì đang được dự đoán với một tập dữ liệu nhỏ? Hoặc chỉ cần nhìn vào kết quả của 'với (mydata, bảng (thừa nhận, gre))'? Logistic hồi quy chỉ là ước tính trên một loạt các bảng.) –
có ... chúng tôi có thể làm theo cách đó .. và tôi theo cùng một phương pháp để đi đến kết luận rằng các trường hợp hiện tại nó được dự đoán thừa nhận = 1.. Nhưng nghĩ rằng R sẽ có một số phím tắt mà sẽ xác nhận suy nghĩ của tôi. Bất kỳ bình luận về việc tìm ra ngưỡng mà sẽ cung cấp cho độ chính xác tối đa từ đối tượng roc? – user2543622
về "Bất kỳ bình luận về việc tìm ra ngưỡng mà sẽ cung cấp cho độ chính xác tối đa từ đối tượng roc?": Tôi nghĩ rằng câu trả lời là coords (g, "tốt nhất") ... – user2543622