160得票3回答
在Bash中如何比较两个流水线?

如何在Bash中不使用临时文件来diff两个管道?假设您有两个命令管道: foo | bar baz | quux 如果你想找到它们输出中的diff,一个解决方案显然是: foo | bar > /tmp/a baz | quux > /tmp/b diff /tmp/a ...

135得票16回答
Python中类似于R的magrittr包中的%>%的函数管道

在R语言中(感谢magrittr),您现在可以通过%>%使用更加函数式的管道语法执行操作。这意味着,您不需要编写以下代码:> as.Date("2014-01-01") > as.character((sqrt(12)^2) 你也可以这样做:> &q...

87得票2回答
在scikit-learn中,pipeline和make_pipeline有什么区别?

我从 sklearn 网页上得到了以下内容: Pipeline: 带有最终估计器的转换流水线 Make_pipeline: 从给定估计器构造管道。这是 Pipeline 构造函数的简写。 但我仍然不明白何时应该使用每个选项。有人可以给我举个例子吗?

87得票5回答
Sklearn管道:在ColumnTransformer中使用OneHotEncode后获取特征名称

我希望在完成管道拟合后获取特征名称。categorical_features = ['brand', 'category_name', 'sub_category'] categorical_transformer = Pipeline(steps=[ ('imputer', Simp...

81得票17回答
我该如何修复"kex_exchange_identification: read: Connection reset by peer"的错误?

我希望你能在GitLab管道中使用PRIVATE_KEY来使用scp复制数据。 错误信息如下: kex_exchange_identification: read: Connection reset by peer Connection reset by x.x.x.x port 22 l...

66得票1回答
如何从标准输入中提取tar归档文件?

我有一个被我使用 split 命令分割成多个文件的大型tar文件。是否可以使用管道进行cat 和解压缩操作? 类似于:cat largefile.tgz.aa largefile.tgz.ab | tar -xz 而不是:cat largefile.tgz.aa largfile.tgz.a...

62得票2回答
从管道中获取模型属性

我通常会得到类似这样的PCA载荷:pca = PCA(n_components=2) X_t = pca.fit(X).transform(X) loadings = pca.components_ 如果我使用scikit-learn管道运行PCA:from sklearn.pipeline ...

56得票2回答
如何使用Joblib或Pickle保存通过Pipeline和GridSearchCV创建的模型?

在使用pipeline和GridSearchCV确定最佳参数后,我如何使用pickle/joblib将此过程保存以便以后重复使用?当它是单个分类器时,我知道如何做到这一点...from sklearn.externals import joblib joblib.dump(clf, 'file...

55得票4回答
仅在特定分支上运行GitLab CI Pipeline

我正试图实现 GitLab CI Pipelines 来构建和部署 Angular 应用程序。在我们的项目中,我们有两个常规分支:master(仅供生产使用)和 develop。对于开发,我们从 develop 分支创建 feature/some-feature 分支。当开发完成后,我们从 f...

44得票3回答
如何将Keras模型插入到scikit-learn管道中?

我正在使用 scikit-learn 自定义管道 (sklearn.pipeline.Pipeline) 与 RandomizedSearchCV 进行超参数优化。这个方法非常好用。 现在,我想将一个 keras 模型作为管道的第一步插入其中。模型的参数应该被优化。计算出的 (拟合的) ke...