18得票2回答
ALS模型的增量训练

我正在尝试找出在使用Apache Spark中的MLlib是否可以进行数据“增量训练”的方法。 我的平台是Prediction IO,它基本上是Spark(MLlib)、HBase、ElasticSearch和一些其他Restful部分的包装器。 在我的应用程序中,“事件”数据实时插入,但...

12得票2回答
如何使用Weka来预测结果

我对Weka很陌生,对这个工具感到困惑。我的数据集涉及水果价格和相关属性。我试图使用数据集来预测特定的水果价格。由于我是Weka的新手,我无法弄清如何完成此任务。请帮助我或指导我参考如何进行预测,以及什么是最好的方法或算法。

8得票1回答
mgcv gam() 错误:模型系数多于数据

我正在使用广义可加模型 (GAM) 分析我的数据集。该数据集包含 32 个观测值,6 个预测变量以及一个响应变量 (即功率)。 我使用 mgcv 包中的 gam() 函数来拟合模型。然而,每当我尝试拟合模型时都会出现以下错误信息: Error in gam(formula.hh, data ...

10得票4回答
使用k-Means聚类算法预测数值

我正在研究机器学习,已经用Python编写了K均值算法的实现。它将二维数据组织成聚类。每个数据点还具有0或1的类值。 我对这个算法感到困惑的是,如何使用它来预测另一组没有0或1的二维数据的值,而是未知的。对于每个聚类,我应该对其中的点进行平均处理以得到0或1,如果一个未知点最接近该聚类,则该...

10得票5回答
如何建议GCC编译器更可能的分支

例子:if (almost_always_false_condition) { // do something } 有没有一种方法可以建议编译器,在99%的条件下将为false。 条件计算需要大约60个周期进行检查,并且编译器本身无法在编译时计算它。 (gcc 4.3)

17得票2回答
将用户反馈纳入机器学习模型中

我已经开发了一个用于分类(0/1)NLP任务的ML模型,并将其部署到生产环境中。该模型的预测结果会显示给用户,用户可以选择反馈(预测结果是否正确)。如何持续将这些反馈信息纳入我的模型中?从用户体验的角度来看,您不希望用户为特定输入纠正/教授系统超过两次/三次,系统应该快速学习,即反馈信息应该被...

10得票1回答
Java对PMML的支持

我对PMML(预测建模标记语言,www.dmg.org)还不熟悉,想知道是否有Java支持(开源/专业),以便创建/解析PMML文件。 起初,我只考虑从Java环境中以编程方式创建/解析PMML文件。 我已经搜索了一些可能性: 开源: jpmml。(PMML 3.2) 使用Java...

32得票3回答
属性错误:'Model'对象没有'predict_classes'属性。

我正在尝试使用预训练和微调的深度学习模型对验证数据进行预测。 该代码遵循Keras博客上“使用极少量数据构建图像分类模型”的示例。以下是代码:import numpy as np from keras.preprocessing.image import ImageDataGenerator ...

15得票4回答
如何在使用tf.keras.preprocessing.image_dataset_from_directory()进行预测时获取文件名?

Keras最近引入了tf.keras.preprocessing.image_dataset_from_directory函数,比tensorflow 2.x中之前的ImageDataGenerator.flow_from_directory方法更高效。 我正在练习catsvsdogs问题,...

13得票2回答
使用lme4进行新水平的预测

我正在尝试拟合一个混合效应模型,然后使用该模型在可能具有不同水平的新数据集上生成估计值。我原以为在新数据集上的估计值将使用估计参数的平均值,但事实并非如此。以下是最小工作示例:library(lme4) d = data.frame(x = rep(1:10, times = 3), ...