9得票1回答
用Pymc3编写自定义似然函数

我正在努力使用pymc3实现具有自定义似然函数的线性回归。 我之前在CrossValidated上发布了这个问题,并被建议在这里发布,因为这个问题更加代码化(关闭帖子here) 假设你有两个独立变量x1、x2和一个目标变量y,以及一个名为delta的指示变量。 当delta为0时,似然函数是...

9得票5回答
在SQL中进行朴素贝叶斯计算

我希望使用朴素贝叶斯算法将文档分类到大量的类别中。我想确认文章中提到的实体名是否真的是该实体,根据的依据是该文章是否与已经验证正确的包含该实体的文章相似。 假设我们在一篇文章中发现了“通用汽车”的文本。我们有一组数据,其中包含文章和其中提到的正确实体。因此,如果我们在新文章中找到了“通用汽车...

9得票1回答
聚类和贝叶斯分类器 Matlab

所以我现在面临一个抉择,我开始学习并应用一些机器学习算法来处理复杂的数据集,现在我已经做到了这一点。我从一开始就计划将两种可能的分类器结合起来,试图制作一个多分类系统。 但是这就是我卡住的地方。我选择了聚类算法(Fuzzy C Means)(在学习了一些K-means样本之后),以及朴素贝叶...

9得票7回答
有人能告诉我为什么在机器学习中我们总是使用高斯分布吗?

例如,我们一直假定数据或信号误差符合高斯分布?为什么呢?

9得票6回答
Tensorflow的超参数调整

我正在寻找一个可以用于直接编写Tensorflow代码(而不是Keras或Tflearn)的超参数调整包。你能给出一些建议吗?

9得票1回答
PYMC3 季节性变量

我相对较新于PYMC3,正在尝试实现没有回归变量的贝叶斯结构时间序列(BSTS)模型,例如R中的这里所拟合的模型。该模型如下: 我可以使用GaussianRandomWalk实现局部线性趋势模型,如下所示: delta = pymc3.GaussianRandomWalk('delta...

8得票5回答
朴素贝叶斯分类器和判别分析准确率严重偏差

我有两种分类方法,判别分析diaglinear分类(朴素贝叶斯)和在Matlab中实现的纯朴素贝叶斯分类器,整个数据集中有23个类别。第一种方法是判别分析: %% Classify Clusters using Naive Bayes Classifier and classify trai...

8得票2回答
处理朴素贝叶斯分类器中缺失的属性

我正在编写一个朴素贝叶斯分类器,用于根据WiFi信号强度执行室内定位。到目前为止,它工作得很好,但我对缺失特征有一些疑问。这经常发生,因为我使用WiFi信号,而WiFi接入点并不随处可得。 问题1:假设我有两个类别,苹果和香蕉,我想将测试实例T1分类如下。 我完全理解朴素贝叶斯分类器的...

8得票2回答
如何在Scikit-learn中使用`Dirichlet Process Gaussian Mixture Model`?(n_components是什么意思?)

对于“使用狄利克雷过程作为先验分布的无限混合模型,聚类数量由数据决定当它们收敛到一定数量的聚类时”这个概念,我的理解是聚类数量由数据决定,当数据收敛到一定数量的聚类时确定该聚类数量。 这个 R实现 https://github.com/jacobian1980/ecostates 也采用了这...

8得票2回答
分类算法性能评估

我手头有一个分类问题,我想使用机器学习算法(可能是贝叶斯或马尔可夫链)来解决这个问题(分类器的选择不影响问题本身)。鉴于给定了一定数量的训练实例,我正在寻找一种方法来衡量已实现分类器的性能,并考虑数据过拟合问题。 也就是说,如果给出 N [1..100] 个训练样本,如果我在每个样本上运行训...