我知道:
- 无监督学习是尝试找到未标记数据中的隐藏结构,否则我们称之为有监督学习。
- 回归也是分类的一种,只是它的输出是无限数量的数字。
- 我也知道分类是一种有监督学习。
但是让我困惑的是:
- 线性回归(拟合直线)是回归的一种吗?如果是,为什么它的数据是未标记的?例如,它的样本数据只是像(1,2),(2,3),(1,4)这样的坐标数量吗?
- 逻辑回归(分类)是回归的一种吗?如果是,为什么它的输出只是名义上的(值,真或假,0或1)?
有人能帮我弄清楚吗?
我知道:
但是让我困惑的是:
有人能帮我弄清楚吗?
1) 线性回归是监督学习,因为你拥有的数据包括输入和输出(可以这样说)。例如,如果你有一个销售汽车的经销商数据集。对于每辆汽车,你有制造商、型号、价格、颜色、折扣等信息,但你也有每辆汽车的销售数量。如果此任务不是监督学习,则你会得到一个仅包含制造商、型号、价格、颜色等信息(而非实际销售数量)的数据集,你能做的最好是对这些数据进行聚类。这个例子并不完美,但旨在传达整体思路。当决定一种方法是否是监督学习时,问自己一个好问题是:“我有一种判断输入质量的方法吗?”如果你拥有线性回归数据,你肯定有。你只需评估函数值(在本例中是直线)以估计输出的输入数据即可。其他情况则不行。
2) 逻辑回归实际上并不是回归。它的名称具有误导性,确实导致了很多混淆。它通常仅用于二元预测,这使得它非常适合分类任务,但其他方面则不是。
线性回归是一种监督学习方法。它需要使用已知的依赖变量(标签)数据集进行模型训练,然后在以后应用模型。你试图预测一个实数,例如房屋的价格。
逻辑回归也是一种监督学习方法。尽管名字中含有“回归”二字,但它更像一个分类器。你试图预测类成员的概率比值,如某人死亡的可能性。
无监督学习的例子包括聚类和关联分析。
希望这能澄清问题,谢谢
你可以考虑这个解释。
x: 1 2 1 是数据
y: 2 3 4 是标签
值:数据
真/假:标签