7得票3回答
选择最近20天的数据。

我是一名有用的助手,可以为您进行文本翻译。 我有一个简单的问题,似乎找不到直接的答案。 假设我有一个包含日期、开盘价、最高价、最低价、收盘价和成交量的数据框。 我想要做的第一件事是找到当前日期,可以使用以下方法: today = pd.datetime.today().date() ...

22得票2回答
使用Python找到优化曲线上的“拐点”

我有一个点列表,这些点是 kmeans 算法的惯性值。 为了确定最优群集的数量,我需要找到曲线开始变平的点。 数据示例 以下是我的值列表如何创建和填充的:sum_squared_dist = [] K = range(1,50) for k in K: km = KMeans(n_...

10得票1回答
如何将实时的Colab笔记本嵌入网站?

我想建立一个网站并将其部署到GitHub Pages或Heroku上。我的问题是:是否可以在我将要托管的网站中嵌入一个实时(我可以运行代码的)Google Colab笔记本? 我希望这个被嵌入的Colab笔记本可以执行Spark代码!! 谢谢!

10得票2回答
为什么 pandas.DataFrame.sum(axis=0) 返回每列的值之和,其中 axis=0 表示行?

在pandas中,axis=0代表行,axis=1代表列。 因此,要获取每行中值的总和,需要调用df.sum(axis=1)。 但是它返回的是每列中的值的总和,反之亦然。 为什么呢? import pandas as pd df=pd.DataFrame({"x":[1,2,3,4,5],...

211得票8回答
无法分配具有形状和数据类型的数组

我在Ubuntu 18上使用numpy分配大型数组时遇到了问题,而在MacOS上没有遇到相同的问题。 我正尝试为一个形状为(156816、36、53806)的numpy数组分配内存。np.zeros((156816, 36, 53806), dtype='uint8') 而且在Ubuntu操...

37得票3回答
网格搜索交叉验证 - XGBoost - 提前停止

我正在尝试使用Scikit-Learn的GridSearchCV在XGBoost上进行超参数搜索。在网格搜索期间,我希望能够进行早停以便大幅减少搜索时间,并期望在我的预测/回归任务上获得更好的结果。我使用Scikit-Learn API调用XGBoost。 model = xgb.XGB...

11得票2回答
用什么方法可以对 Pandas 数据框进行子集切片?

嘿,我是一个新手,刚接触到 df.query()。 为什么人们会使用 df.query() 呢?当你可以直接使用方括号表示法过滤数据框时,为什么要使用它?官方的 Pandas 教程似乎也更倾向于后者。 使用方括号表示法:df[df['age'] <= 21] 使用pandas的que...

37得票2回答
Spyder和Jupyter有何区别?

我正在学习用Python进行数据科学,但是我的问题是我仍然不理解Spyder和Jupyter之间的区别! 我希望你们能帮我理解它们之间的区别,非常感谢。

16得票1回答
model.LGBMRegressor.fit(x_train, y_train)和lightgbm.train(train_data, valid_sets = test_data)有什么区别?

我尝试了两种实现Light GBM的方法。期望它们返回相同的值,但实际上并没有。 我认为lgb.LightGBMRegressor()和lgb.train(train_data, test_data)应该返回相同的准确性,但事实并非如此。所以我想知道为什么? 用于分割数据的函数def data...

27得票3回答
如何绘制多个 pandas 数据框的列

我有一个包含三列(year, action, comedy)的数据框 total_year。 如何在 y 轴上绘制两列数据 (action 和 comedy)?我的代码只绘制了一列:total_year[-15:].plot(x='year', y='action', figsize=(10...