Tôi có một tập dữ liệu với ba cột đầu tiên sau đây. Bao gồm ID giỏ hàng (số nhận dạng duy nhất), Số tiền bán (đô la) và ngày giao dịch. Tôi muốn tính toán cột sau cho mỗi hàng của tập dữ liệu, và tôi muốn nó trong Python.Python - sắp xếp chuỗi thời gian và các chức năng "đến nay"
Bán trước của cùng một giỏ hàng (nếu có); Đếm bán cho đến nay cho giỏ hiện tại; Có nghĩa là Ngày cho giỏ hiện tại (nếu có); Max Đến ngày cho giỏ hiện tại (nếu có)
Basket Sale Date PrevSale SaleCount MeanToDate MaxToDate
88 $15 3/01/2012 1
88 $30 11/02/2012 $15 2 $23 $30
88 $16 16/08/2012 $30 3 $20 $30
123 $90 18/06/2012 1
477 $77 19/08/2012 1
477 $57 11/12/2012 $77 2 $67 $77
566 $90 6/07/2012 1
Tôi khá mới với Python, và tôi thực sự đấu tranh để tìm thấy bất cứ điều gì để làm điều đó một cách lạ mắt. Tôi đã sắp xếp dữ liệu (như trên) bởi BasketID và Date, vì vậy tôi có thể bán số lượng lớn trước đó bằng cách dịch chuyển tiếp lên một cho mỗi giỏ. Không có đầu mối làm thế nào để có được MeanToDate và MaxToDate một cách hiệu quả ngoài việc lặp ... bất kỳ ý tưởng nào?
Định dạng dữ liệu hiện tại của bạn là gì (trong ba cột đầu tiên)? Nó là một tập tin hoặc bạn đang sử dụng một số loại cấu trúc dữ liệu hiện nay? – askewchan
xin lỗi, tôi quên đề cập đến. nó đến từ một tệp văn bản, nhưng được lưu trữ trong một khung dữ liệu của gấu trúc. –