我正在对sklearn中的鸢尾花数据集进行逻辑回归,我知道数学原理并尝试实现它。在最后一步,我得到了一个预测向量,这个向量代表着数据点属于类1或类2(二分类)的概率。
现在我想将这个预测向量转化为目标向量。如果概率大于50%,则相应的数据点将属于类1,否则属于类2。使用0表示类1,用1表示类2。
我知道有一个for循环版本,只需循环遍历整个向量即可。但是当大小变大时,for循环非常昂贵,所以我想更有效地执行它,例如numpy的矩阵运算,它比在for循环中执行矩阵操作更快。
有关更快方法的任何建议?
现在我想将这个预测向量转化为目标向量。如果概率大于50%,则相应的数据点将属于类1,否则属于类2。使用0表示类1,用1表示类2。
我知道有一个for循环版本,只需循环遍历整个向量即可。但是当大小变大时,for循环非常昂贵,所以我想更有效地执行它,例如numpy的矩阵运算,它比在for循环中执行矩阵操作更快。
有关更快方法的任何建议?