Đây là lần đầu tiên tôi thử dùng Pandas. Tôi nghĩ rằng tôi có một trường hợp sử dụng hợp lý, nhưng tôi đang vấp ngã. Tôi muốn tải một tệp phân cách tab vào một khung dữ liệu Pandas, sau đó nhóm nó theo biểu tượng và vẽ nó với x.axis được chỉ mục bởi cột TimeStamp. Đây là một tập hợp con của dữ liệu:Pandas DataFrame - chỉ mục mong muốn có giá trị trùng lặp
Symbol,Price,M1,M2,Volume,TimeStamp
TBET,2.19,3,8.05,1124179,9:59:14 AM
FUEL,3.949,9,1.15,109674,9:59:11 AM
SUNH,4.37,6,0.09,24394,9:59:09 AM
FUEL,3.9099,8,1.11,105265,9:59:09 AM
TBET,2.18,2,8.03,1121629,9:59:05 AM
ORBC,3.4,2,0.22,10509,9:59:02 AM
FUEL,3.8599,7,1.07,102116,9:58:47 AM
FUEL,3.8544,6,1.05,100116,9:58:40 AM
GBR,3.83,4,0.46,64251,9:58:24 AM
GBR,3.8,3,0.45,63211,9:58:20 AM
XRA,3.6167,3,0.12,42310,9:58:08 AM
GBR,3.75,2,0.34,47521,9:57:52 AM
MPET,1.42,3,0.26,44600,9:57:52 AM
Lưu ý hai điều về cột TimeStamp;
- có giá trị trùng lặp và
- các khoảng không đều.
Tôi nghĩ tôi có thể làm một cái gì đó như thế này ...
from pandas import *
import pylab as plt
df = read_csv('data.txt',index_col=5)
df.sort(ascending=False)
df.plot()
plt.show()
Nhưng phương pháp read_csv đặt ra một ngoại lệ "cột Cố gắng 1-X như chỉ số nhưng không tìm thấy bản sao". Có một tùy chọn cho phép tôi chỉ định một cột chỉ mục với các giá trị trùng lặp không?
Tôi cũng muốn sắp xếp các khoảng thời gian không đều theo một độ phân giải thứ hai, tôi vẫn muốn vẽ nhiều sự kiện trong một giây, nhưng có lẽ tôi có thể giới thiệu một chỉ mục duy nhất, sau đó sắp xếp giá của tôi với nó?
Cảm ơn bạn. Tôi sẽ tham gia pystatsmodels - nếu bạn đang tìm kiếm noobs vấp ngã với các trường hợp sử dụng, tôi có thể là lãnh thổ màu mỡ. – kavu
Nếu theo thời gian thô bạn có nghĩa là chỉ số nguyên có lẽ là một tỷ lệ lấy mẫu, đây là một upvote. Cả thế giới các bản ghi âm khoa học đều tuyệt vọng cho một phần mở rộng cho TimeSeries theo hướng đó ... – meteore