最新 'data-science' 问题 - 第4页

关联标签

14得票6回答

如何在Python Pandas中读取本地存储的ORC文件？

我可以将ORC文件类比于带有列标题和行标签包含数据的CSV文件吗？如果可以，我是否可以将其读入一个简单的pandas dataframe中？我不太熟悉像Hadoop或Spark这样的工具，但是只为了在Python中查看本地ORC文件的内容就必须要理解它们吗？文件名是`someFile.sn...

pythonpandaspysparkdata-scienceorc

10得票4回答

Pandas中的新列，其值取决于其他列。

我有一个示例数据如下： datetime col1 col2 col3 2021-04-10 01:00:00 25. 50. 50 2021-04-10 02:00:00. 25. 50. 50 2021-04-10...

pythonpandasnumpydata-science

7得票1回答

不了解如何为分类特征实现嵌入？

通过我在网上找到的各种例子，我仍然不太理解如何为神经网络模型创建嵌入层，特别是当我有混合数字和分类数据时。例如，以下面的数据集为例： numerical_df = pd.DataFrame(np.random.randint(0,100,size=(100, 3)), columns=['n...

pythonneural-networkkerasdata-science

17得票3回答

如何在Python的sklearn中使用GridSearchCV进行特征选择

我正在使用带有交叉验证的递归特征消除（rfecv）作为 randomforest classifier 的特征选择器，如下所示。 X = df[[my_features]] #all my features y = df['gold_standard'] #labels clf = Ran...

pythonmachine-learningscikit-learndata-sciencegrid-search

13得票1回答

cv2.approxPolyDP()和cv2.arcLength()的工作原理是什么？

这些函数是如何工作的？我正在使用Python3.7和OpenCv 4.2.0。提前致谢。approx = cv2.approxPolyDP(cnt, 0.01*cv2.arcLength(cnt, True), True)

pythonopencvcomputer-visiondata-scienceimage-manipulation

12得票1回答

类型错误：call()缺少1个必需的位置参数：“inputs”。

我试图根据“input_data”中的特征来预测收盘价（1或0）。但是当我尝试运行代码时，我遇到了以下错误，不确定如何修复。非常感谢任何帮助。Traceback (most recent call last): File "F:/Machine Learning/SK_Learn/SVM_...

pythonmachine-learningkerasdeep-learningdata-science

10得票1回答

如何使用pygal在一个图表中绘制多个图形？

我正在尝试使用pygal在一个图中绘制多个系列，每个系列有两个测量值（因此实际上是num_of_time_series x 2个图）。例如，假设我的数据是：from collections import defaultdict measurement_1=defaultdict(None,...

pythonpython-2.7chartsdata-sciencepygal

12得票4回答

如何使用SimpleImputer或等效工具仅转换某些列

我正在使用scikit库迈出第一步，并发现我需要回填数据帧中的仅某些列。我仔细阅读了文档，但我仍然无法弄清如何实现这一点。为了更具体地说明，假设我有：A = [[7,2,3],[4,np.nan,6],[10,5,np.nan]] 我希望将第二列用平均值填充，但不要对第三列进行操作。我...

pythonpandasscikit-learndata-scienceimputation

284得票17回答

“Conda”未被识别为内部或外部命令

我在我的Windows 7 Professional电脑上安装了Anaconda3 4.4.0（32位），并在Jupyter Notebook中引入了NumPy和Pandas，所以我认为Python已经正确安装。但是当我在命令提示符中输入 conda list 和 conda --versio...

pythonanacondacondadata-science

8得票2回答

在本地IDE上使用Google Colab资源。

我有一个大问题...我看到很多博客文章，说你可以使用Colab前端编辑本地Jupiter Notebook。然而我不明白...实际的优势是使用像DataSpell或某些本地IDE这样的工具，在Colab上远程使用Notebook，并使用Colab资源进行计算，因此您可以获得： IDE级...

idedata-sciencegoogle-colaboratory