我对被称为“DHT搜索引擎”的Btdigg.org非常感兴趣。根据这篇文章,它不存储任何内容,甚至没有数据库。那么它是如何工作的呢?它不需要像其他正常搜索引擎一样收集元信息并将其存储在数据库中吗?用户提交查询后,它会扫描DHT网络并实时返回结果吗?这可能吗?
我对被称为“DHT搜索引擎”的Btdigg.org非常感兴趣。根据这篇文章,它不存储任何内容,甚至没有数据库。那么它是如何工作的呢?它不需要像其他正常搜索引擎一样收集元信息并将其存储在数据库中吗?用户提交查询后,它会扫描DHT网络并实时返回结果吗?这可能吗?
编辑:
自发布此回答以来,一些DHT客户端已实现了优化(BEP 51),使您可以查询它们托管的信息哈希,从而大大降低索引成本。
想要深入了解DHT及其应用程序,请参阅Scott Wolchok的论文和演示文稿“Crawling BitTorrent DHTs for Fun and Profit”。他把自动搜索引擎的想法作为他对DHT安全性研究的附注。
他的论文PDF:
他在DEFCON 18上的演讲(第1和第2部分)
https://www.usenix.org/legacy/event/woot10/tech/full_papers/Wolchok.pdf
第三节中使用的方法似乎表明需要一个数据库来存储所有的种子数据。虽然性能更好,但它可能不是真正的DHT搜索引擎。