这是我第一次尝试使用Pandas。我认为我有一个合理的应用场景,但我卡住了。我想将一个制表符分隔的文件加载到Pandas Dataframe中,然后按Symbol对其进行分组,并使用TimeStamp列作为x轴索引进行绘图。以下是数据的子集:
Symbol,Price,M1,M2,Volume,TimeStamp
TBET,2.19,3,8.05,1124179,9:59:14 AM
FUEL,3.949,9,1.15,109674,9:59:11 AM
SUNH,4.37,6,0.09,24394,9:59:09 AM
FUEL,3.9099,8,1.11,105265,9:59:09 AM
TBET,2.18,2,8.03,1121629,9:59:05 AM
ORBC,3.4,2,0.22,10509,9:59:02 AM
FUEL,3.8599,7,1.07,102116,9:58:47 AM
FUEL,3.8544,6,1.05,100116,9:58:40 AM
GBR,3.83,4,0.46,64251,9:58:24 AM
GBR,3.8,3,0.45,63211,9:58:20 AM
XRA,3.6167,3,0.12,42310,9:58:08 AM
GBR,3.75,2,0.34,47521,9:57:52 AM
MPET,1.42,3,0.26,44600,9:57:52 AM
关于 TimeStamp 列,有两点需要注意:
- 它具有重复值;
- 时间间隔是不规则的。
我认为我可以做这样的事情...
from pandas import *
import pylab as plt
df = read_csv('data.txt',index_col=5)
df.sort(ascending=False)
df.plot()
plt.show()
但是read_csv方法会引发一个异常,“尝试将1-X列作为索引,但发现有重复值”。是否有选项可以允许我指定一个有重复值的索引列?
我也希望将我的不规则时间戳间隔对齐到一秒分辨率,我仍然希望为给定的一秒钟绘制多个事件,但也许我可以引入一个唯一的索引,然后将我的价格对齐到它上面?