时间戳 纬度 经度 事件 13307266 102.86400972 70.64039541 "事件A" 13311695 102.8082912 70.47394645 "事件A" 13314940 102.82240522 70.6308513 "事件A" 13318949 102.83402128 70.64103035 "事件A" 13334397 102.84726242 70.66790352 "事件A"首先,我将其分类为100个区域,以减少维度和复杂性。
时间戳 区域 13307266 47 13311695 65 13314940 51 13318949 46 13334397 26接下来,我进行了时间序列分析,然后在这里卡了两个月,阅读了很多文献并找到了以下解决方案: * ARIMA(自回归模型) * 机器学习
我想利用Python进行机器学习来进行预测,但真的搞不清楚该怎么做。具体来说,是否有特定于此用例的Python库/开源代码,我可以构建它们。
编辑1: 为了澄清,数据在某种程度上依赖于过去的数据,但随着时间的推移是均匀分布的。 最好的方法是将数据视为由一个算法控制的N个代理人,他们的任务是从网格中选择资源。资源是社会经济结构的函数,并且也强烈依赖于地理位置。" 算法 " 能够预测需求区域和时间是有利的。
附:对于像ARIMA这样的自回归模型,Python已经有了一个库 http://pypi.python.org/pypi/statsmodels 。