26得票3回答
在Sklearn管道中放置定制函数

我的分类方案包括以下几个步骤: SMOTE (合成少数类过采样技术) Fisher标准选择特征 标准化(Z-score归一化) SVC (支持向量分类器) 上述方案中要调整的主要参数是特征保留的百分位数(2.)和SVC的超参数(4.), 我想通过网格搜索来进行调优。 当前的解决方案构建了一...

26得票1回答
通知GitLab中所有组成员流水线失败

目标是使每个人可以根据自己的意愿收到每次管道失败的通知。目前,我们中的任何人都可以在此项目分支上运行管道,并且只有管道的创建者会收到电子邮件,其他人则不会。我已经尝试在项目、组和全局级别将通知级别设置为“监视”和“自定义(勾选了失败管道)”,但都没有成功。关于通知的帮助页面表示,自定义通知级别...

25得票9回答
通知管道右侧左侧故障?

我喜欢在我的Shell脚本中使用生成器类似的模式来连接函数,就像这样:parse_commands /da/cmd/file | process_commands 然而,这种模式的基本问题在于,如果parse_command遇到错误,我发现唯一通知process_command失败的方法是通过...

25得票3回答
使用PostgreSQL的CI/CD流程失败,显示"数据库未初始化且未指定超级用户密码"错误。

我正在使用Bitbucket管道与PosgreSQL进行CI/CD。根据这篇文档,PostgreSQL服务在bitbucket-pipelines.yml中被描述为:definitions: services: postgres: image: postgres:9.6...

24得票3回答
Scikit-learn管道 - 如何对不同列应用不同的转换

我对sklearn中的pipeline还比较陌生,现在遇到了这个问题:我的数据集中有混合文本和数字的列,即某些列仅包含文本,其余列包含整数(或浮点数)。 我想知道是否有可能构建一个pipeline,在其中可以对文本特征调用LabelEncoder(),对数字列调用MinMaxScaler()...

23得票3回答
使用Data.ByteString实现类Unix的“cat”程序的Haskell性能

我有以下的Haskell代码,实现了一个简单版本的"cat"命令行工具。通过在一个400MB的文件上使用"time"进行性能测试,它大约慢了3倍。(我用来测试的确切脚本在下面的代码中)。 我的问题是: 1. 这是一个有效的性能测试吗? 2. 我如何使这个程序运行更快? 3. 怎样才能识别H...

22得票3回答
现代(流水线/超标量)处理器上x86 rep指令的性能

最近我在写x86汇编语言(只是为了好玩),我想知道rep前缀的字符串指令在现代处理器上是否确实具有性能优势,还是只是为了向后兼容而实现的。 我可以理解英特尔最初为处理器一次只运行一个指令而实现rep指令的原因,但现在使用它们是否有益呢? 对于编译成更多指令的循环,需要填充更多的流水线和/或按顺...

22得票3回答
如何在scikit learn中向管道对象的单个部分传递参数?

我需要向我的RandomForestClassifier传递一个sample_weight参数,方法如下:X = np.array([[2.0, 2.0, 1.0, 0.0, 1.0, 3.0, 3.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0...

22得票10回答
管道OrdinalEncoder值错误,发现未知类别

请不要过于苛刻,我正在转行进入数据科学领域,没有计算机科学或编程背景 - 所以我可能在做某些极其愚蠢的事情。我已经研究了几个小时,但没有成功。 目标:使用OrdinalEncoder运行Pipeline。 问题:使用OrdinalEncoder调用时代码无法运行,而不使用OrdinalEn...

22得票5回答
在PowerShell管道上输出二进制数据

我需要将一些数据传输到一个程序的标准输入 (stdin)中: 前四个字节是一个32位的无符号整数,表示数据的长度。这4个字节与C语言中存储无符号整数的方式完全相同,我称其为二进制数据。 剩余的字节则是数据本身。 在C语言中,这很简单:WriteFile(h, &cb, 4); /...