不确定这是否是一个很好的地方提出这个问题,但我被告知CrossValidated不是。因此,所有这些问题都涉及sklearn,但如果您对逻辑回归有一般性的见解,我也很想听听。
1)数据必须标准化(平均值为0,标准差为1)吗?
2)在sklearn中,我如何指定我想要什么类型的正则化(L1 vs L2)?请注意,这与惩罚不同;惩罚是指分类错误,而不是系数惩罚。
3)我该如何使用来进行变量选择?即类似于线性回归的套索。
4)在使用正则化时,我如何优化C,即正则化强度?是否内置了某些功能,还是我必须自己处理?
可能最有帮助的是一个例子,但我会感激任何有关这些问题的见解。
这是我的起点:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html
非常感谢您的帮助!