得票数最多 'data-science' 问题 - 第4页

关联标签

22得票2回答

使用Python找到优化曲线上的“拐点”

我有一个点列表，这些点是 kmeans 算法的惯性值。为了确定最优群集的数量，我需要找到曲线开始变平的点。数据示例以下是我的值列表如何创建和填充的：sum_squared_dist = [] K = range(1,50) for k in K: km = KMeans(n_...

pythonnumpyscikit-learndata-science

21得票2回答

Pandas的dropna()函数无法工作

我正在尝试从 pandas 数据帧中删除缺失值。我已经使用了 dropna()（应该可从数据帧中删除所有缺失行）。但它不起作用。以下是代码：import pandas as pd import numpy as np prison_data = pd.read_csv('https:/...

pythonpandasdata-science

19得票9回答

Pandas数据帧上的分位数归一化

简单来说，在Python中如何对一个大的Pandas数据框（可能有2,000,000行）应用分位数归一化？ PS. 我知道有一个名为rpy2的软件包可以在子进程中运行R，使用R中的分位数归一化。但事实是，当我使用以下数据集时，R无法计算出正确的结果：5.690386092696389541e...

pythondeep-learningdata-science

19得票2回答

Python中与R的browser()函数相当的函数是什么？

标题已经说明了一切。当你在使用RStudio和R时，只需在代码中的任何位置放置一个browser()函数调用就可以轻松地进行调试并查看出错原因。那么在Python中是否有这样的方法呢？我慢慢开始对打印语句进行调试感到非常烦恼。

pythonrdebuggingdata-science

18得票2回答

在Keras中使用sample_weight进行序列标注

我正在处理一个带有不平衡类的顺序标记问题，并且希望使用sample_weight来解决不平衡问题。基本上，如果我训练模型大约10个时期，就会获得很好的结果。如果我训练更多时期，val_loss一直在下降，但是结果变得更差。我猜测模型只是检测到更多优势类别，对较小的类别产生了负面影响。该模型...

pythondeep-learningkerasdata-science

18得票3回答

Python Pandas中分组对象的时间差异

我有一个数据框，看起来像这样：from to datetime other ------------------------------------------------- 11 1 2016-11-06 22:00:00 ...

pythonpandasdifferencedata-sciencepandas-groupby

17得票3回答

如何在Python的sklearn中使用GridSearchCV进行特征选择

我正在使用带有交叉验证的递归特征消除（rfecv）作为 randomforest classifier 的特征选择器，如下所示。 X = df[[my_features]] #all my features y = df['gold_standard'] #labels clf = Ran...

pythonmachine-learningscikit-learndata-sciencegrid-search

17得票2回答

在Windows 10上安装CUDA

我正在尝试安装CUDA工具包，以便能够在个人电脑上使用Thundersvm。然而，在GUI安装程序中，我一直收到以下消息:“您已经安装了更新版本的NVIDIA Frameview SDK。” 我在CUDA论坛上读到，这很可能是由于安装了Geforce Experience（我已安装）。因此，我...

windowscudadata-sciencedriver

17得票2回答

绘制scikit-learn（sklearn）SVM决策边界/面

我目前正在使用Python的Scikit库执行具有线性核的多类SVM。以下是样本训练数据和测试数据：模型数据：x = [[20,32,45,33,32,44,0],[23,32,45,12,32,66,11],[16,32,45,12,32,44,23],[120,2,55,62,82,1...

pythonmachine-learningscikit-learndata-sciencesvm

16得票3回答

如何在pandas中将重复的数据行收集到单个行中？

我有一个数据集，其中包含NBA球员每场比赛的平均统计数据。由于一些球员在不同的赛季效力于不同的球队，所以他们的统计数值会重复出现。例如： Player Pos Age Tm G GS MP FG 8 Jarrett Allen C ...

pythonpandasdataframedata-science