监督学习,无监督学习,回归分析。

5

我知道:

  1. 无监督学习是尝试找到未标记数据中的隐藏结构,否则我们称之为有监督学习。
  2. 回归也是分类的一种,只是它的输出是无限数量的数字。
  3. 我也知道分类是一种有监督学习。

但是让我困惑的是:

  1. 线性回归(拟合直线)是回归的一种吗?如果是,为什么它的数据是未标记的?例如,它的样本数据只是像(1,2),(2,3),(1,4)这样的坐标数量吗?
  2. 逻辑回归(分类)是回归的一种吗?如果是,为什么它的输出只是名义上的(值,真或假,0或1)?

有人能帮我弄清楚吗?

4个回答

15

1) 线性回归是监督学习,因为你拥有的数据包括输入和输出(可以这样说)。例如,如果你有一个销售汽车的经销商数据集。对于每辆汽车,你有制造商、型号、价格、颜色、折扣等信息,但你也有每辆汽车的销售数量。如果此任务不是监督学习,则你会得到一个仅包含制造商、型号、价格、颜色等信息(而非实际销售数量)的数据集,你能做的最好是对这些数据进行聚类。这个例子并不完美,但旨在传达整体思路。当决定一种方法是否是监督学习时,问自己一个好问题是:“我有一种判断输入质量的方法吗?”如果你拥有线性回归数据,你肯定有。你只需评估函数值(在本例中是直线)以估计输出的输入数据即可。其他情况则不行。

2) 逻辑回归实际上并不是回归。它的名称具有误导性,确实导致了很多混淆。它通常仅用于二元预测,这使得它非常适合分类任务,但其他方面则不是。


1
非常感谢您的黄金法则:“我有一种判断输入质量的方法吗?”这真的很简单但非常有效。现在我明白了。有时候机器学习中的名称确实令人困惑。 - wuchang
1
我不同意你的观点:“逻辑回归实际上并不是回归分析”。 “回归分析”的定义是“一种用于估计变量之间关系的统计过程”(来源:维基百科)。回归分析试图找到因变量和一个或多个自变量之间的关系。在逻辑回归的情况下,我们预测一个概率,这是一个在[0,1]域中的变量。我们仍然试图找到该变量与自变量之间的关系。仍然是回归分析。 - valentin
2
@valentin,你说的是正确的,但只适用于“统计回归”,而当我们谈论“监督学习中的回归”时,答案就不同了。请参考此链接:https://chemicalstatistician.wordpress.com/2014/01/05/machine-learning-lesson-of-the-day-classification-and-regression/。 - backtrack

5

线性回归是一种监督学习方法。它需要使用已知的依赖变量(标签)数据集进行模型训练,然后在以后应用模型。你试图预测一个实数,例如房屋的价格。

逻辑回归也是一种监督学习方法。尽管名字中含有“回归”二字,但它更像一个分类器。你试图预测类成员的概率比值,如某人死亡的可能性。

无监督学习的例子包括聚类和关联分析。


1
  • 监督学习 计算机接收输入(自变量)和相关标签,表示观测的类别(因变量) 计算机试图学习将每个类别映射到输入的规则 根据计算机学习的规则对新数据进行分类
  • 无监督学习 计算机只接收输入(自变量) 计算机试图基于相似性/差异性对事物进行分类

希望这能澄清问题,谢谢


-1

你可以考虑这个解释。

  1. 线性回归(拟合直线)是一种回归类型吗?如果是,为什么它的数据没有标签?例如,它的样本数据只是一些坐标的数量,如(1,2),(2,3),(1,4)?

     x: 1 2 1 是数据

     y: 2 3 4 是标签

  1. 逻辑回归(分类)是一种回归类型吗?如果是,为什么它的输出只是名义上的(值、真或假、0或1)?

     值:数据

     真/假:标签


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接