首字母缩写:
tab=millisecond time apple bought
asb=apple shares bought
tas=millisecond apple sold
ass=apple shares sold
tgb=millisecond time google bought
gsb=google shares bought
tgs=millisecond google sold
gss=google shares sold
训练数据:
username,tab,asb,tas,ass,tgb,gsb,tgs,gss
a,234234,212,456789,412,234894,42,459289,0
b,234634,24,426789,2,234274,3,458189,22
c,239234,12,156489,67,271274,782,459120,3
d,234334,32,346789,90,234254,2,454919,2
分类:
a earned $45
b earned $60
c earned ?
d earned ?
目标:根据训练数据预测用户c和d的收入
我是否应该添加任何数据点到这个数据集中?也许我应该使用替代数据?由于这只是我自己创建的一个学习练习,可以添加任何有用的特征。
这些数据需要被归一化,我还应该了解哪些其他概念? 也许不应该将时间作为特征参数,因为股票价格会随时间波动。