42得票3回答
R中的xgboost:xgb.cv如何将最优参数传递给xgb.train

我一直在研究R中的xgboost包,并进行了几个演示和教程,但仍然感到困惑:在使用xgb.cv进行交叉验证后,最佳参数是如何传递给xgb.train的?还是应该根据xgb.cv的输出计算理想参数(例如nround,max.depth)? param <- list("objective...

14得票2回答
glm()模型的交叉验证

我想对我之前在R中建立的一些glm模型进行10倍交叉验证。我对boot包中的cv.glm()函数有点困惑,尽管我已经阅读了很多帮助文件。当我提供以下公式时:library(boot) cv.glm(data, glmfit, K=10) 这里的 "data" 参数是指整个数据集还是仅指测试集?...

9得票1回答
在R中对具有负值的3D loess平滑设置上限为0。

我有一个有点奇怪的问题,但希望有人能帮助我。我试图创建一个湖底表面图,然后添加一些显示水生植物频率的点,以便可视化湖泊中的水生植物分布情况。 目前,我正在使用R中的scatterplot3d和lattice包分别创建散点图3D和线框图来创建表面图。为了实现我感兴趣的绘图类型,我已将深度转换为...

9得票1回答
使用caret进行R语言分类问题中,predict(model)和predict(model$finalModel)的区别

这两者有何不同? predict(rf, newdata=testSet) and predict(rf$finalModel, newdata=testSet) 我使用preProcess=c("center", "scale")来训练模型。 tc <- trainC...

13得票1回答
使用三个月的数据进行多元时间序列预测

我有三个月的数据(每一行对应每一天),我想为此执行多元时间序列分析: 可用的列是 - Date Capacity_booked Total_Bookings Total_Searches %Variation 每个日期在数据集中有1个记录,且有3个月的数据。我希望拟合一个多元时间序...

35得票3回答
如何在sklearn中获取分类器对预测的置信度分数?

我想要获取每个预测的置信度分数,以显示分类器对其正确性的确定程度。 我需要类似这样的东西: 分类器在其预测上有多确定? 类别 1:81% 的可能性是类别 1 类别 2:10% 类别 3:6% 类别 4:3% 我的代码示例:features_train, features_test, l...

13得票2回答
神经网络中的时间序列未来预测(N点向前预测)大规模迭代训练

(N=90) 使用神经网络进行点预测: 我正在尝试预测3分钟后,即180个点。由于我将时间序列数据压缩为每2个点取平均值,因此我必须进行(N = 90)步预测。 我的时间序列数据以秒为单位给出。值在30-90之间。它们通常从30到90,然后从90到30,如下面的示例所示。 我的数据可...

82得票8回答
数值错误:传递的项目数量不正确 - 意义和建议?

我收到了错误信息:ValueError: Wrong number of items passed 3, placement implies 1,但我很难确定问题出在哪里以及如何解决它。 我不太理解这个错误的含义,这使得我很难进行故障排除。我还在我的Jupyter Notebook中包含了触...

32得票1回答
为什么要在结构化数据中使用循环神经网络?

我一直在使用Keras开发前馈神经网络(FNNs)和循环神经网络(RNNs),处理的结构化数据形状为 [instances, time, features],FNNs和RNNs的性能相同(除了RNNs需要更多的计算时间)。 我还模拟了表格数据(下面是代码),在这里我期望RNN比FNN表现更好...

15得票6回答
如何基于先前事件预测下一个事件的发生?

基本上,我有一个相当长的列表(一年的数据),记录了单个离散事件发生的时间(对于我的当前项目,是某人打印东西的时间列表)。基于这个列表,我想构建某种统计模型,以预测所有先前事件时间的情况下下一个事件(下一个打印作业)最可能的时间。 我已经阅读了这篇文章,但是回答并没有完全解决我在我的项目中所想...