按字母顺序然后按数字顺序排序的 Elasticsearch

Question

按字母顺序然后按数字顺序排序的 Elasticsearch

3

我希望找到一种优雅的方式，首先按字母顺序排序结果，然后按数字排序。

我的当前解决方案是使用下一个排序脚本在数字前插入“~”，“~”在字母“z”之后按字典顺序排列：

"sort": {
  "_script":{
      "script" : "s = doc['name.raw'].value; n = org.elasticsearch.common.primitives.Ints.tryParse(s.split(' ')[0][0]); if (n != null) { '~' + s } else { s }",
      "type" : "string"
  }
 }

但我想知道是否有更优雅、更高效的解决方案。

输入：

ZBA ABC ...
ABC SDK ...
123 RIU ...
12B BTE ...
11J TRE ...
BCA 642 ...

期望的输出结果：

ABC SDK ...
BCA 642 ...
ZBA ABC ...
11J TRE ...
12B BTE ...
123 RIU ...

- dimartiro

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Val · Accepted Answer

您可以使用自定义分析器在索引时执行相同的操作，该分析器利用pattern_replace字符过滤器。与为每个查询运行脚本排序相比，将其放在索引中执行更加高效。

它的工作方式与您的解决方案相同，即如果我们检测到一个数字，我们会在值前面添加一个波浪符号~，否则我们不做任何操作，但我们是在索引时执行，并将结果值索引到name.sort字段中。

PUT /tests
{
  "settings": {
    "analysis": {
      "char_filter": {
        "pre_num": {
          "type": "pattern_replace",
          "pattern": "(\\d)",
          "replacement": "~$1"
        }
      },
      "analyzer": {
        "number_tagger": {
          "type": "custom",
          "tokenizer": "keyword",
          "filter": [],
          "char_filter": [
            "pre_num"
          ]
        }
      }
    }
  },
  "mappings": {
    "test": {
      "properties": {
        "name": {
          "type": "string",
          "fields": {
            "sort": {
              "type": "string",
              "analyzer": "number_tagger",
              "search_analyzer": "standard"
            }
          }
        }
      }
    }
  }
}

然后您可以对数据进行索引。

POST /tests/test/_bulk
{"index": {}}
{"name": "ZBA ABC"}
{"index": {}}
{"name": "ABC SDK"}
{"index": {}}
{"name": "123 RIU"}
{"index": {}}
{"name": "12B BTE"}
{"index": {}}
{"name": "11J TRE"}
{"index": {}}
{"name": "BCA 642"}

那么你的查询可以简单地写成这样：

POST /tests/_search
{
  "sort": {
    "name.sort": "asc"
  }
}

你会得到以下的响应：

{
  "hits": {
    "hits": [
      {
        "_source": {
          "name": "ABC SDK"
        }
      },
      {
        "_source": {
          "name": "BCA 642"
        }
      },
      {
        "_source": {
          "name": "ZBA ABC"
        }
      },
      {
        "_source": {
          "name": "11J TRE"
        }
      },
      {
        "_source": {
          "name": "12B BTE"
        }
      },
      {
        "_source": {
          "name": "123 RIU"
        }
      }
    ]
  }
}