Tôi đang tạo gói R của riêng mình và tôi đã tự hỏi các phương pháp có thể có mà tôi có thể sử dụng để thêm bộ dữ liệu (chuỗi thời gian) vào gói của mình là gì. Dưới đây là các chi tiết cụ thể:Cách đặt bộ dữ liệu vào gói R
Tôi đã tạo thư mục con gói được gọi là dữ liệu và tôi biết rằng đây là vị trí tôi nên lưu các tập dữ liệu mà tôi muốn thêm vào gói của mình. Tôi cũng nhận thức được thực tế là các tệp có chứa dữ liệu có thể. rda, .txt hoặc .csv tệp.
Mỗi chuỗi dữ liệu mà tôi muốn thêm vào gói bao gồm một cột đơn (ví dụ: dạng 340 hoặc 4.5) và mỗi chuỗi dữ liệu khác nhau về độ dài.
Cho đến giờ, tôi đã lưu tất cả bộ dữ liệu vào một tệp .txt. Tôi cũng đã tải thành công dữ liệu bằng cách sử dụng chức năng dữ liệu(). Tuy nhiên, vấn đề không được giải quyết.
Sự cố là mỗi chuỗi dữ liệu được tải dưới dạng yếu tố ngoại trừ chuỗi dài nhất. Chuỗi tải khi các yếu tố chứa các giá trị bị thiếu (của biểu mẫu '.'). Tôi đã phải thêm các giá trị còn thiếu này để làm cho mỗi cột dữ liệu có cùng độ dài. Tôi đã thử lưu dữ liệu dưới dạng các cột không bằng nhau, nhưng tôi đã nhận được thông báo lỗi sau khi gọi dữ liệu().
Hậu quả của việc thêm các giá trị bị thiếu để tải dữ liệu là khi dữ liệu được tải, tôi cần xóa NA để có thể phân tích dữ liệu của mình! Vì vậy, điều này rõ ràng không phải là một cách tốt để làm việc.
Lý tưởng nhất (tôi giả sử), tôi muốn dữ liệu tải dưới dạng vectơ số hoặc dưới dạng danh sách. Bằng cách này, tôi sẽ không cần NA thêm vào cuối mỗi bộ truyện.
Làm cách nào để giải quyết vấn đề này? Tôi có nên lưu tất cả dữ liệu vào một tệp duy nhất không? Nếu vậy, tôi nên làm gì ở định dạng nào? Có lẽ tôi nên lưu các tập dữ liệu vào một số tập tin? Một lần nữa, trong đó định dạng? Cách thực hành tốt nhất để làm điều này là gì? Bất kỳ lời khuyên nào cũng sẽ được đánh giá cao.
Xin cảm ơn, user1265067. Đề xuất của bạn đã giúp tôi rất nhiều. Cuối cùng, tôi quyết định lưu từng chuỗi, theo định dạng ưa thích của tôi, dưới dạng tệp .rda riêng biệt. Phương pháp này làm việc một sự quyến rũ đối với tôi. Bây giờ tôi có thể chuyển sang tạo các tệp .rd và đưa chúng vào thư mục con người để mô tả các tập dữ liệu trong gói của tôi. Chúc mừng! Nhân tiện, xin lỗi vì đã không làm cho câu hỏi của tôi dễ hiểu - đó là một vấn đề khó khăn để đưa vào từ ngữ. –
@GraemeWalsh: Bạn có thể giải thích cách bạn sử dụng các tệp .rda này trong mã của mình không? Có thể sử dụng các tệp .rds không? – Ankit
@Ankit Sử dụng hàm load() để tải dữ liệu vào vùng làm việc. http://en.wikibooks.org/wiki/R_Programming/Working_with_data_frames#Reading_and_saving_data Điều này giúp ích? –