8得票6回答
计算相似度百分比或计算超过2个对象之间的相关性。

假设我有四个物体(a,b,c,d),我让五个人根据它们的外观或其他因素对它们进行分类(类别1或类别2)。这些物体的标签由五个人提供,如下所示: df <- data.frame(a = c(1,2,1,2,1), b=c(1,2,2,1,1), c= c(2,1,2,2,2), d=c...

10得票3回答
如何将复杂的方程式放入 R 公式中?

我们以树的直径为自变量,以树高为因变量。这类数据有多种不同的方程式可用于建模和比较结果。但是,我们无法确定如何将其中一种方程正确地放入相应的R公式格式中。可以使用R中的“trees”数据集作为示例。 data(trees) df <- trees df$h <- df$Heigh...

8得票3回答
Ruby曲线拟合(对数回归)包

我正在寻找一个Ruby gem或库,用于进行对数回归(将曲线拟合到对数方程)。我已经尝试了statsample(http://ruby-statsample.rubyforge.org/),但它似乎没有我需要的功能。有人有什么建议吗?

12得票6回答
匹配时变(一维)信号的算法

我想知道有没有一种用于比较时间相关信号的算法/技术。理想情况下,这种假设的算法将接受两个信号作为输入,并返回一个数字,表示信号之间的相似度百分比(0表示两个信号在统计上无关,1表示它们完全匹配)。 当然,我意识到我的请求存在问题,即我不确定如何在比较这两个信号的上下文中正确定义“相似性”,所...

14得票4回答
如何使用Sonar重新分析项目的完整历史记录?

我希望将自项目开始以来的整个历史记录加载到Sonar中。 基本上,我想执行以下代码: 0)从Subversion检出版本1 1)从Subversion检出下一个版本 2)如果提交日期与前一个日期相同,则返回1 3) 运行mvn sonar:sonar,使用提交时间覆盖构建时间 4) 如果...

18得票1回答
如何从curve_fit获取置信区间

我的问题涉及到统计学和Python,我在两个方面都是初学者。我正在运行一个模拟,对于每个自变量(X)的值,我会生成1000个因变量(Y)的值。我所做的是为每个X的值计算Y的平均值,并使用scipy.optimize.curve_fit拟合这些平均值。曲线拟合得很好,但我也想画出置信区间。我不确...

24得票5回答
跨文档词项TF-IDF得分之和的解释

首先,让我们提取每个文档中每个词语的TF-IDF得分: from gensim import corpora, models, similarities documents = ["Human machine interface for lab abc computer applicatio...

11得票2回答
在C、C++或Fortran中计算多元正态分布的累积分布函数

有没有一个开源的 C、C++ 或者 Fortran 库可以计算高斯分布的多元数值累积分布函数(CDF),其中维度较大(>3,不是二元或三元)? 我相信 IMSL 可以做到; http://www.roguewave.com/portals/0/products/imsl-numerical-...

10得票6回答
在R工作流中编写函数与逐行解释的区别

关于在R语言中为统计项目开发工作流程的问题已经有很多文章了。最流行的工作流似乎是Josh Reich的LCFD模型。其中包含一个main.R文件,其中包含代码:source('load.R') source('clean.R') source('func.R') source('do.R') ...

15得票4回答
在一个集合中检测不同元素的高效算法

想象你有一个包含五个元素(A-E)的集合,每个元素都有一些数值属性(例如“心率”的几次观测结果): A = {100, 110, 120, 130} B = {110, 100, 110, 120, 90} C = { 90, 110, 120, 100} D = {120, 100, 12...