决策树中的多元分类是什么?

10

我是AI领域的新手,正在阅读有关决策树的资料。我参考了AIMA教材,这是推荐的标准人工智能简介。在决策树章节中,书中讨论了一个案例,其中在第一个属性分裂后,没有属性剩余但正负例子仍未分离,这意味着这些例子具有完全相同的描述... 他们建议解决这种情况的方法是返回其余样例的多数分类。 我想知道粗体部分的意思?什么是一组样例的“多数分类”?

2个回答

20

如果只有两类,他们会说“多数派”。多数派只是将“多数派”概括到超过两个类别。这意味着在该叶子中选择最频繁的类别并将其作为您的预测结果。例如,如果您正在对球的颜色进行分类,一个叶子中有3个蓝球,2个红球和2个白球,则返回蓝球作为您的预测。


1
哦,好的,所以如果我们有10个正例和5个未分离的负例,并且没有剩余属性来分割它们,那么算法将只返回正例(YES)作为这些属性的值? - anonuser0428
1
@RobNeuhaus,如果我们有10个正例和10个负例怎么办?换句话说,是均分。只需随机返回两个类别中的一个即可吗?谢谢。 - Kelvin

1
在决策树中,当您到达叶节点但仍不清楚要分配给它的类时,您必须返回多数分类,这意味着考虑叶子父级的所有示例,并查看数据集中出现的最常见类。

这个回答如何比被采纳的答案更优? - chb

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接