搜索整个文档：使用C#和Elasticsearch的NEST

Question

搜索整个文档：使用C#和Elasticsearch的NEST

3

我想使用Nest在Elasticsearch中查询一百万个文档。我的代码：

var response = client.Search<MyObject>(s => s
          .Index("test")
          .Type("one")
          .Query(q => q.
                Term(
                    t => t.name, "A"
                )
          )
          .Size(10000)
          .Scroll("10m")
          .Pretty()
        );

我的MyObject类：

public class MyObject
    {
        public int id { get; set; }
        public int age { get; set; }
        public string lastname { get; set; }
        public string name { get; set; }
    }

问题在于当这个查询在前 10000 个文档中没有找到时，它将不会继续搜索其余的结果滚动 API。

我的问题是如何实现这一点（即在 Scroll API 中遍历整个页面，即使没有命中）？

- Hassan Shaitou

var response = client.Search<MyObject>(search string, new SearchUrlParameters { Pretty = true }); 替换此查询。 - silambarasan vediappan

@silambarasanvediappan 你确定吗？默认情况下，Elastic 只启用了10000个文档！ - Hassan Shaitou

我使用滚动API来处理每页10k的数据... - Hassan Shaitou

兄弟，我的问题是如何在ScrollAPI中循环查询页面，即使有空的hits...(不认为从(0)开始会解决问题)...但还是谢谢你的帮助 :) - Hassan Shaitou

1

哦！太好了。这是因为术语查询找到了搜索字符串的确切术语。 - silambarasan vediappan

显示剩余5条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Russ Cam · Accepted Answer

查询将搜索所有文档，但仅返回前.Size个文档。您可以使用.From()和.Size()分页结果，但是在分页超过一百万个文档时，深度分页可能会成为问题。为此，最好使用滚动API以有效地检索100万个文档。NEST具有可观察的帮助程序ScrollAll()来协助完成此操作。
var client = new ElasticClient(); // number of slices in slice scroll var numberOfSlices = 4; var scrollObserver = client.ScrollAll<MyObject>("1m", numberOfSlices, s => s .MaxDegreeOfParallelism(numberOfSlices) .Search(search => search .Index("test") .Type("one") .Term(t => t.name, "A") ) ).Wait(TimeSpan.FromMinutes(60), r => { // do something with documents from a given response. var documents = r.SearchResponse.Documents; });