2013-07-01 25 views
10

một câu hỏi có lẽ đơn giản Tôi đã cố gắng tạo một đồ thị sai như được hiển thị trong trang 532 của trường "Khám phá thống kê sử dụng R".Giải thích "stat_summary = mean_cl_boot" tại ggplot2?

Mã này có thể được tìm thấy ở đây http://www.sagepub.com/dsur/study/DSUR%20R%20Script%20Files/Chapter%2012%20DSUR%20GLM3.R:

line <- ggplot(gogglesData, aes(alcohol, attractiveness, colour = gender)) 
line + stat_summary(fun.y = mean, geom = "point") + 
stat_summary(fun.y = mean, geom = "line", aes(group= gender)) + 
stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2) + 
labs(x = "Alcohol Consumption", y = "Mean Attractiveness of Date (%)", colour = "Gender") 

tôi đã đưa ra cùng một đồ thị; biến trục y của tôi chỉ có 4 điểm (nó là một thang rời rạc, 1-4), bây giờ trục y có các điểm 1,5, 2, 2,5 trong đó các dòng khác nhau.

Và câu hỏi đặt ra là: các điểm và đồ thị này mô tả những gì? Tôi giả định rằng phần quan trọng là stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2) là họ có đếm các quan sát cho nhóm đó và cấp đó (trục x) không? Họ có tần số không? Hay chúng là tỷ lệ?

Tôi thấy điều này http://docs.ggplot2.org/0.9.3/stat_summary.html nhưng nó không giúp tôi

Cảm ơn bạn

Trả lời

11

Dưới đây là những gì các ggplot2 book trên trang 83 nói về mean_cl_boot()

Function   Hmisc original  Middle Range 
mean_cl_boot() smean.cl.boot() Mean Standard error from bootstrap 

Tôi nghĩ rằng đó là smean.cl.boot() từ gói Hmisc nhưng được đổi tên thành mean.cl.boot() trong ggplot2.

here là định nghĩa của chức năng ban đầu từ gói Hmisc:

smean.cl.boot là một thực hiện rất nhanh của bootstrap phi tham cơ bản để đạt được giới hạn sự tự tin cho người dân có nghĩa là không giả bình thường

1

tôi sao chép đồ thị sử dụng mã của bạn và tôi nhận được cùng một biểu đồ được hiển thị trong sách của Trường, Khám phá Thống kê Sử dụng R, hình 12.12, trang 532, ngoại trừ thứ tự của các biến trên trục x. Trục y hiển thị biến liên tục, Mean Attractiveness of Date (%). Khoảng tin cậy 95%, được tạo ra - như bạn chỉ ra - với hàm stat_summary() và đối số mean_cl_boot là các khoảng tin cậy bootstrap sử dụng hàm smean.cl.boot() trong Hmisc, như được chỉ ra bởi một người bình luận ở trên. Chức năng này được mô tả ở trang 262 của trang HMisc documentation. Các ggplot2 documentation on mean_cl_boot là thưa thớt và ngăn chặn các mô tả trong gói Hmisc.

Lưu ý rằng các đối số cho mean_cl_boot trong ggplot2 giống với các đối số trong hàm smean.cl.boot trong gói Hmisc. Bạn có thể thay đổi mức độ tin cậy mong muốn từ giá trị mặc định là 0,95 bằng cách sử dụng đối số conf.int và số lượng mẫu bootstrap bằng cách sử dụng đối số B. Ở đây, ví dụ, là mã để tạo cùng một lô với khoảng tin cậy 99% và 5000 mẫu bootstrap:

line <- ggplot(gogglesData, aes(alcohol, attractiveness, colour = gender)) 
line + stat_summary(fun.y = mean, geom = "point") + 
stat_summary(fun.y = mean, geom = "line", aes(group= gender)) + 
stat_summary(fun.data = mean_cl_boot, conf.int = .99, B = 5000, geom = "errorbar", width = 0.2) + 
labs(x = "Alcohol Consumption", y = "Mean Attractiveness of Date (%)", colour = "Gender")