如果我想将深度学习应用于我目前拥有的传感器数据集,我需要大量的数据,否则我们可能会看到过度拟合。不幸的是,这些传感器仅活跃了一个月,因此需要增加数据。我目前拥有的数据以以下形式显示为数据框:
在进一步研究这个网站后,似乎扩充影响的是numpy数组。虽然它声明了它是一个多元扩充,但不太确定它是如何有效地进行的。
我想在浮点数数字列(如
index timestamp cas_pre fl_rat ...
0 2017-04-06 11:25:00 687.982849 1627.040283 ...
1 2017-04-06 11:30:00 693.427673 1506.217285 ...
2 2017-04-06 11:35:00 692.686310 1537.114807 ...
....
101003 2017-04-06 11:35:00 692.686310 1537.114807 ...
现在我想要使用tsaug
包来增强一些特定的列。增强可以采用以下形式:
my_aug = (
RandomMagnify(max_zoom=1.2, min_zoom=0.8) * 2
+ RandomTimeWarp() * 2
+ RandomJitter(strength=0.1) @ 0.5
+ RandomTrend(min_anchor=-0.5, max_anchor=0.5) @ 0.5
)
增强库的文档接下来使用以下方式使用增强: X_aug, Y_aug = my_aug.run(X, Y)
在进一步研究这个网站后,似乎扩充影响的是numpy数组。虽然它声明了它是一个多元扩充,但不太确定它是如何有效地进行的。
我想在浮点数数字列(如
cas_pre
和fl_rat
)上应用这种一致的扩充,以便不会与原始数据和每个列之间的关系产生太大分歧。我不想将其应用于像timestamp
这样的行中。我不确定如何在Pandas中实现这一点。