用于基准测试的大型文本文件词典,包含随机单词?

4

我想知道是否有人能够指向一个非常非常大的随机单词字典,用于测试一些高性能字符串数据结构?我发现有些字典大小在 ~2MB 左右...但如果可能的话,我希望能够使用更大的字典。我猜想一定有一些大型标准字符串数据集可以使用。谢谢!

2个回答

4

1
我建议您查看TREC(文本检索会议)提供的材料。那里有一些很好的数据集,可能符合您的要求。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接