163得票6回答
方法“train_test_split”(scikit Learn)中的参数“stratify”

我正在尝试使用scikit Learn包中的train_test_split函数,但是我在stratify参数上遇到了麻烦。以下是代码:from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.t...

100得票4回答
Keras Sequential模型中的验证数据有什么用途?

我的问题很简单,就是在Sequential模型中,传递给model.fit的验证数据是什么? 另外,它是否会影响模型的训练(通常会使用验证集来选择模型的超参数,但我认为这在此处并不会发生)? 我指的是可以像这样传递验证集的内容:# Create model model = Sequenti...

82得票17回答
如何向管理层展示平庸的开发者如何伤害团队

我处于一种棘手的境地,负责管理一家小公司的开发团队。我说“管理”是因为尽管我分配工作并提供反馈,但我实际上没有惩罚个人的权力。 我的团队中有些人让我很茫然,他们无法独立工作,需要大量指导,并且通常会在独立工作时对项目造成灾难性影响,甚至导致项目失败。当发生失败时,我必须挽救项目并将其推向(有...

78得票4回答
在分割训练和测试数据之前还是之后对数据进行规范化?

我想将我的数据分为训练集和测试集,是在拆分之前还是之后对数据进行归一化?对于构建预测模型是否有任何影响?

57得票6回答
情感分析的训练数据

我在企业领域中想获取已经分类为正/负情感的文档语料库,需要一份大量提供公司评论的文档集,例如分析师和媒体提供的公司评论。 我发现了一些关于产品和电影评论的语料库,但是否有一个包含公司评论的商业领域语料库,与商业用语相匹配?

41得票6回答
公开的垃圾邮件过滤训练集

我是机器学习新手,我的第一个项目想写一个朴素贝叶斯垃圾邮件过滤器。我想知道是否有任何公开可用的标记为垃圾邮件/非垃圾邮件的训练集,最好是纯文本而不是关系数据库的转储(除非它们对其进行漂亮的打印)? 我知道其他类型的文本分类可以使用公开可用的数据库,特别是新闻文章文本。我只是没有找到同样类型的...

41得票7回答
神经网络训练的数据集

我正在寻找一些相对简单的数据集,用于测试和比较人工神经网络的不同训练方法。 我希望数据不需要太多的预处理即可将其转换为输入格式,包括输入和输出的列表,并进行归一化处理(范围在0-1之间)。感谢提供任何链接。

34得票4回答
修改训练图像以训练神经网络。

我目前正在尝试制作一个程序,仅基于外观来区分烂橙和可食用的橙子。为此,我计划使用卷积神经网络来训练烂橙和正常橙子的数据。在一些搜索后,我只能找到一个黑色背景下约150个烂橙和150个正常橙子的数据库(http://www.cofilab.com/downloads/)。显然,机器学习模型需要至...

34得票4回答
如何在Node.js中训练一个模型(使用tensorflow.js)?

我想制作一个图像分类器,但我不会Python。Tensorflow.js 可以与我熟悉的JavaScript一起使用。可以用它来训练模型吗?如果可以,步骤是什么?老实说,我不知道从哪里开始。 唯一我了解到的是如何加载“mobilenet”,这显然是一组预先训练好的模型,并用它对图片进行分类:...

28得票7回答
如何将数据框划分为训练、验证和测试集?

我正在使用R进行机器学习。遵循标准的机器学习方法,我想将我的数据随机分成训练、验证和测试数据集。在R中如何实现这一点? 我知道有一些相关问题是如何分成两个数据集的(例如这个帖子),但并不明显如何将其分成三个数据集。顺便说一下,正确的方法是使用三个数据集(包括一个验证集来调整您的超参数)。