什么是词汇树,如何构建它?

10

当涉及到在大型数据库中进行类似图像或文本的快速查询时,我阅读了很多有关词汇树的内容。但是我找不到任何好的(易于理解的)描述,介绍这样一个词汇树是什么以及如何构建其特征。

2个回答

7
词汇树是一种紧凑的图像检索方法。实现这个算法基本上有三个步骤,它高度依赖于其他计算机视觉技术,例如SIFT特征。
第一步是使用SIFT描述符构建kmeans树。该树的叶节点包含一组SIFT描述符。第二步是使用您在第一步中构建的词汇树来构建图像数据库。您可以将此过程视为将图像量化为向量空间。然后第三步是针对图像查询图像数据库。当然还有一些详细的技术,如倒排列表等。
这里有一个良好的词汇树实现 - libvot。它基本上遵循我上面描述的三个步骤。它使用C++11标准的多线程库来加速构建过程,因此运行得非常快。
这里是关于它的原始研究paper。它在计算机视觉社区中具有很高的影响力。

1

Showing BOF representation

词汇树是通过将视觉单词聚类成簇所形成的东西。这需要应用树形结构,从而形成了词汇树。以下图表将使事情更加清晰。
同时,请查看this:

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接