27得票3回答
DMatches中的距离属性是什么意思?

我有一个简短的问题:在OpenCV中进行特征匹配时,MatOfMatches中的DMatches的distance属性是什么意思? 我知道我必须过滤掉距离更大的匹配项,因为它们不如距离更小的匹配项好。但这个属性的含义是什么?它是一种偏差吗?

25得票3回答
scikit-learn TfidfVectorizer的含义是什么?

我在阅读关于TfidfVectorizer的scikit-learn实现的文档,但是我不理解该方法的输出结果,例如: new_docs = ['He watches basketball and baseball', 'Julie likes to play basketball', 'Ja...

21得票5回答
HoG特征如何以图形方式表示?

我正在实现“人体检测的梯度方向直方图”中的梯度方向直方图特征,并希望将结果可视化。这些特征的所有论文都使用标准的可视化方法,但我找不到任何有关如何生成这些方法的描述。如果能提供解释或相关链接,我将不胜感激。

21得票4回答
为什么在主成分分析中要最大化方差?

我正在尝试学习PCA,看到其目标是最大化方差,但不太明白为什么要这样做。如果有其他相关主题的解释,将会很有帮助。

19得票2回答
从FeatureUnion + Pipeline中获取特征名称

我正在使用FeatureUnion来结合从事件标题和描述中发现的特征:union = FeatureUnion( transformer_list=[ # Pipeline for pulling features from the event's title ...

16得票1回答
在scikit-learn中组合特征提取类

我正在使用`sklearn.pipeline.Pipeline`来链接特征提取器和分类器。有没有一种方法可以并行地结合多个特征选择类(例如来自`sklearn.feature_selection.text`)并连接它们的输出? 我的代码现在看起来如下:pipeline = Pipeline(...

15得票2回答
TensorFlow变量列表的特征列

从TensorFlow文档中可以清楚地了解如何使用tf.feature_column.categorical_column_with_vocabulary_list创建特征列,该列将某些字符串作为输入并输出一个独热向量。例如:vocabulary_feature_column = tf...

14得票2回答
CountVectorizer:向量化文本中没有出现"I"

我是scikit-learn的新手,目前正在学习朴素贝叶斯(Multinomial)。现在,我正在使用sklearn.feature_extraction.text从文本中进行向量化,但出现了一个问题:当我对一些文本进行向量化时,输出数组中没有单词“我”的出现。 代码:x_train = [...

14得票4回答
如何处理传统机器学习中的字符串特征数组?

问题 假设我们有一个看起来像这样的数据框: age job friends label 23 'engineer' ['World of Warcraft', 'Netflix', '9gag']...

14得票4回答
Python的TSFRESH库处理时间太长

我发现TSfresh库是一种将时间序列数据转化为特征的方法。该文档十分出色,似乎非常适合我正在开发的项目。我想实现TFresh文档快速入门部分中分享的以下代码。看起来相当简单。from tsfresh import extract_relevant_features feature_filte...