我有1000个独立用户,数据集包含这些用户在过去一年内的活动。总记录数超过300K。LSTM RNN的输入具有与这些用户对应的特征向量。用户也被包括在内,因为每个用户的行为可能因人而异。网络应该学习每个用户的行为,并且能够基于同一用户的过去信息预测下一个行为。如何在LSTM RNN中为每个用户维护单独的隐藏状态。
以下博客文章与我的问题类似:
https://towardsdatascience.com/multi-state-lstms-for-categorical-features-66cc974df1dc
更新
我的数据集如下:
我将数据集转换成了一个3D的numpy数组,并将其重塑为(记录数量,时间步长,特征数)。
问题如下:
1)是否需要对“用户”属性进行编码?
2)对于这个问题,正确的批量大小是多少?是批量=1000(不同用户的数量)吗?
3)我需要在每个批次输入模型之前包含每个用户的数据吗?
或者
请建议此问题的正确实现。