11得票1回答
DecisionTreeClassifier的predict_proba方法返回0或1。

我正在尝试使用决策树分类器,基于特定参数来识别两个类别(重命名为0和1)。我使用一个数据集对其进行训练,然后在“测试数据集”上运行它。当我尝试计算测试数据集中每个数据点的概率时,它只返回0或1。我想知道问题出在哪里。 这是示例代码: clf=tree.DecisionTreeClassifie...

11得票2回答
如何在 Pandas 数据框的特定列中搜索字符串值,并在存在时输出该行的数据框?

我希望能够搜索我保存在.pkl文件中的数据库。 我已经加载了.pkl文件并将其存储在名为load_data的变量中。 现在,我需要使用raw input接受一个字符串输入,并在我的数据集的一个特定列'SMILES'中搜索该字符串。 如果字符串匹配,则需要显示整行数据,即该行对应的所有列值...

11得票1回答
模型得分()与r2_score()的区别

我正在训练一个LinearRegression()分类器,试图衡量其预测准确性。from sklearn.metrics import r2_score from sklearn.linear_model import LinearRegression regr_rf = LinearRegr...

11得票3回答
sklearn_extra安装问题

[in]: from sklearn_extra.cluster import KMedoids [out]: ModuleNotFoundError: No module named 'sklearn_extra' 接下来,我尝试通过以下方式安装sklearn_extra: [...

10得票2回答
获取sklearn中一个节点的决策路径

我想获取scikit-learn中DecisionTreeClassifier的决策树(即规则集)从根节点到给定节点(由我提供)的决策路径。 clf.decision_path 指定样本经过的节点,这可能有助于获取样本遵循的规则集,但如何获取树中特定节点之前的规则集呢?

10得票3回答
Python3 + Pandas样式 + 更改交替行颜色

你好,我正在使用Pandas展示一个表格。有没有一种函数可以应用交替的行颜色来使其更易读?使用以下代码,我将表格发送到邮件中并且它能正常工作。 我的代码: count = 1000 df = pandas.DataFrame.from_dict(result) df["Total"] = ...

9得票1回答
Imputer减小了我数据框中的列尺寸。

print(np.shape(ar_fulldata_input_xx)) 输出结果: (9027, 1443) 现在我使用Imputer来填补数据框ar_fulldata_input_xx中的缺失值,具体如下。 fill_NaN = Imputer(missing_values=...

9得票1回答
调整Scikit-Learn KNN中的leaf_size以减少时间消耗

我是一名有用的助手,可以为您翻译文本。以下是需要翻译的内容: 我试图实现手写字符识别的KNN算法,但发现代码执行时间较长。当我添加了参数leaf_size并将其值设为400时,我观察到代码执行所需的时间显著减少。 原始代码: knn = KNeighborsClassifier(n_ne...

9得票4回答
将Pandas数据框中的列转换为独热标签

我有一个类似于以下的Pandas数据框: Col1 ABC 0 XYZ A 1 XYZ B 2 XYZ C 通过在ABC列上使用pandas的get_dummies()函数,我可以得到以下结果: Col1 A B C 0 XYZ 1...

9得票2回答
类型错误:不可哈希类型

我写了一小段代码,使用sklearn进行线性回归。 我创建了一个包含两列的csv文件(列名为X和Y,其中包含一些数字),当我读取文件时,我可以看到内容被正确读取 - 如下所示。 然而,当我尝试使用命令datafile[:,:]或datafile[:,-1]等引用列时,我遇到了"unhash...