Trong khi tạo các ô phân tán nhiều điểm trong R (ví dụ: ggplot()
), có thể có nhiều điểm nằm phía sau các đối tượng khác và không hiển thị. Ví dụ thấy cốt truyện dưới đây:Giảm kích thước tệp PDF của lô bằng cách lọc các đối tượng ẩn
Đây là một biểu đồ phân tán của vài trăm ngàn điểm, nhưng hầu hết trong số đó là đằng sau các điểm khác. Vấn đề là khi đưa đầu ra vào một tệp vectơ (ví dụ một tệp PDF), các điểm vô hình sẽ làm cho kích thước tệp quá lớn và tăng mức sử dụng bộ nhớ và cpu trong khi xem tệp.
Một giải pháp đơn giản là đưa đầu ra vào ảnh bitmap (ví dụ TIFF hoặc PNG), nhưng chúng mất chất lượng véc tơ và có thể lớn hơn về kích thước. Tôi đã thử một số máy nén PDF trực tuyến, nhưng kết quả có cùng kích thước với tệp gốc của tôi.
Có giải pháp nào tốt không? Ví dụ một số cách để lọc các điểm không hiển thị, có thể trong quá trình tạo cốt truyện hoặc sau đó bằng cách chỉnh sửa tệp PDF?
Giải pháp được khuyến nghị là một âm mưu lục giác. Tuy nhiên, trong một âm mưu hexbin màu cho biết số lượng các giá trị trong mỗi thùng và bạn dường như sử dụng màu sắc cho cái gì khác. – Roland
+1 cho hexbin. Các tùy chọn khác là 'sunflowerplot' và gói' bigvis': https://github.com/hadley/bigvis – Ben
@Roland Có, khi bạn đoán màu sắc của các điểm có ý nghĩa, vì vậy đối với trường hợp hexbin của tôi không phải là giải pháp tốt – Ali