我正在使用Python的statsmodels.api进行二元结果的逻辑回归预测。根据教程,我使用Logit。但是,在测试数据集上进行预测时,每条记录的输出都是介于0和1之间的小数。
这不应该给我0和1吗?或者我需要使用round函数或其他方法进行转换吗?请注意,保留HTML标记,请勿解释。
请原谅这个问题的初学者之问。我正在踏上这段旅程。
我正在使用Python的statsmodels.api进行二元结果的逻辑回归预测。根据教程,我使用Logit。但是,在测试数据集上进行预测时,每条记录的输出都是介于0和1之间的小数。
这不应该给我0和1吗?或者我需要使用round函数或其他方法进行转换吗?请注意,保留HTML标记,请勿解释。
请原谅这个问题的初学者之问。我正在踏上这段旅程。
predicted = results.predict(x_for_prediction)
predicted_choice = (predicted > threshold).astype(int)
如果将响应解释为概率的单位间隔,除了损失考虑之外,另一个有助于理解的角度是将其视为二项式结果,而不是伯努利结果。特别地,在您的问题中,除了概率响应之外,是否存在每种情况下试验次数的对应物?如果有的话,那么逻辑回归可以重新表达为二项式(计数)响应,其中(整数)计数将是通过概率和试验次数的乘积获得的四舍五入的期望值。