得票数最多 'sklearn-pandas' 问题 - 第4页

关联标签

11得票1回答

DecisionTreeClassifier的predict_proba方法返回0或1。

我正在尝试使用决策树分类器，基于特定参数来识别两个类别（重命名为0和1）。我使用一个数据集对其进行训练，然后在“测试数据集”上运行它。当我尝试计算测试数据集中每个数据点的概率时，它只返回0或1。我想知道问题出在哪里。这是示例代码： clf=tree.DecisionTreeClassifie...

pythondecision-treerocsklearn-pandas

11得票2回答

如何在 Pandas 数据框的特定列中搜索字符串值，并在存在时输出该行的数据框？

我希望能够搜索我保存在.pkl文件中的数据库。我已经加载了.pkl文件并将其存储在名为load_data的变量中。现在，我需要使用raw input接受一个字符串输入，并在我的数据集的一个特定列'SMILES'中搜索该字符串。如果字符串匹配，则需要显示整行数据，即该行对应的所有列值...

loopspandassearchsklearn-pandas

11得票1回答

模型得分()与r2_score()的区别

我正在训练一个LinearRegression()分类器，试图衡量其预测准确性。from sklearn.metrics import r2_score from sklearn.linear_model import LinearRegression regr_rf = LinearRegr...

scikit-learnsklearn-pandas

11得票3回答

sklearn_extra安装问题

[in]: from sklearn_extra.cluster import KMedoids [out]: ModuleNotFoundError: No module named 'sklearn_extra' 接下来，我尝试通过以下方式安装sklearn_extra： [...

pythonscikit-learninstallationpackagesklearn-pandas

10得票2回答

获取sklearn中一个节点的决策路径

我想获取scikit-learn中DecisionTreeClassifier的决策树（即规则集）从根节点到给定节点（由我提供）的决策路径。 clf.decision_path 指定样本经过的节点，这可能有助于获取样本遵循的规则集，但如何获取树中特定节点之前的规则集呢？

pythonscikit-learndecision-treesklearn-pandas

10得票3回答

Python3 + Pandas样式 + 更改交替行颜色

你好，我正在使用Pandas展示一个表格。有没有一种函数可以应用交替的行颜色来使其更易读？使用以下代码，我将表格发送到邮件中并且它能正常工作。我的代码： count = 1000 df = pandas.DataFrame.from_dict(result) df["Total"] = ...

pythonpython-2.7python-3.xpandassklearn-pandas

9得票1回答

Imputer减小了我数据框中的列尺寸。

print(np.shape(ar_fulldata_input_xx)) 输出结果: (9027, 1443) 现在我使用Imputer来填补数据框ar_fulldata_input_xx中的缺失值，具体如下。 fill_NaN = Imputer(missing_values=...

pandasmachine-learningscikit-learnsklearn-pandas

9得票1回答

调整Scikit-Learn KNN中的leaf_size以减少时间消耗

我是一名有用的助手，可以为您翻译文本。以下是需要翻译的内容：我试图实现手写字符识别的KNN算法，但发现代码执行时间较长。当我添加了参数leaf_size并将其值设为400时，我观察到代码执行所需的时间显著减少。原始代码： knn = KNeighborsClassifier(n_ne...

machine-learningscikit-learnknnsklearn-pandaskdtree

9得票4回答

将Pandas数据框中的列转换为独热标签

我有一个类似于以下的Pandas数据框： Col1 ABC 0 XYZ A 1 XYZ B 2 XYZ C 通过在ABC列上使用pandas的get_dummies()函数，我可以得到以下结果： Col1 A B C 0 XYZ 1...

pythonpandassklearn-pandasone-hot-encoding

9得票2回答

类型错误：不可哈希类型

我写了一小段代码，使用sklearn进行线性回归。我创建了一个包含两列的csv文件（列名为X和Y，其中包含一些数字），当我读取文件时，我可以看到内容被正确读取 - 如下所示。然而，当我尝试使用命令datafile[:,:]或datafile[:,-1]等引用列时，我遇到了"unhash...

scikit-learnsklearn-pandas