使用MongoDB索引Markdown文件

3
我正在寻找一个以文档为导向的数据库解决方案 - 首选MongoDB - 用于索引不断增长且频繁更改的(pandoc) Markdown文件。据我所知,MongoDB有一个干净的文本索引器,但我之前没有使用过MongoDB,唯一相关的是一个预处理HTML的索引过程。我考虑的情景是:自动索引Markdown文件,其中Markdown语法用于创建键(例如## FOOO -> header2:FOO ),并且键/值对的分层结构保留与它们在文档中出现的方式相同。这只能通过MongoDB实现吗?还是我总是需要预处理将Markdown转换为类似BSON文件的东西,然后将其摄入MongoDB?

我重新阐述了问题,以便更加聚焦。 - Cutú Chiqueño
1个回答

0

你为什么想要使用MongoDB呢?我认为ElasticSearch更适合这个目的,它基本上是为索引文本而构建的。然而 - 与MongoDB一样 - 如果你想提高查找文档的精度,你需要在保存之前处理文档,因为你不会得到任何自动化的东西。整个文档需要作为JSON对象发送到ElasticSearch,但你也可以将整个未经处理的Markdown文本存储在属性中。

我不确定MongoDB是否具有全文索引,但ElasticSearch还将文档的所有索引属性组合用于全文搜索。此外,你还可以定义索引中不同属性的重要性。例如,标题可能比其余文本更重要,...


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接