在R中,grep通常会使用一个正则表达式来匹配多个字符串的向量。
问题:有没有可能用多个正则表达式来匹配单个字符串?(不使用循环遍历每个单独的正则表达式模式)
背景:我有7000多个关键字作为几个类别的指标。我不能更改该关键词词典。该词典具有以下结构(第1列中的关键字,数字表示属于这些关键字的类别)。
ab 10 37 41
abbrach* 38
abbreche 39
abbrich* 39
abend* 37
abendessen* 60 63
aber 20 23 45
abermals 37
使用 "|" 连接那么多关键词并不可行(而且我不知道哪一个关键词生成了匹配结果)。同时,仅仅颠倒 "patterns" 和 "strings" 是不可行的,因为这些模式有截断,反向操作会导致失效。
[相关问题,其他编程语言]