我有一组搜索词,希望能够匹配至少两个词的所有项的正则表达式。
搜索词:war|army|fighting|rebels|clashes
匹配:这周战争中反叛军和军队之间发生了几次冲突。(4次命中)
不匹配:在打击恐怖主义的战争中,奥巴马政府希望增加无人机攻击的数量。(仅1次命中)
背景:我使用Tiny Tiny RSS收集和过滤大量新闻源用于新闻报道项目。每天我会得到1000-2000条订阅项,并希望通过关键字进行筛选。但是只使用|OR表达式会有太多误报,所以我想要匹配一个订阅项中至少两个搜索词。
谢谢!
编辑:
我对正则表达式知之甚少,所以一直使用简单的|OR运算符。我尝试将搜索词放在括号中(war|fighting|etc){2,},但这只匹配一个订阅项中相同的词。
编辑2:抱歉造成混淆,我对正则表达式等一切都很陌生。事实上:正则表达式查询一个MySQL数据库。它在tt-rss后端作为过滤器输入,只允许一行(尽管理论上可以无限制输入字符)。导入订阅项到MySQL数据库时会使用该过滤器。
搜索词:war|army|fighting|rebels|clashes
匹配:这周战争中反叛军和军队之间发生了几次冲突。(4次命中)
不匹配:在打击恐怖主义的战争中,奥巴马政府希望增加无人机攻击的数量。(仅1次命中)
背景:我使用Tiny Tiny RSS收集和过滤大量新闻源用于新闻报道项目。每天我会得到1000-2000条订阅项,并希望通过关键字进行筛选。但是只使用|OR表达式会有太多误报,所以我想要匹配一个订阅项中至少两个搜索词。
谢谢!
编辑:
我对正则表达式知之甚少,所以一直使用简单的|OR运算符。我尝试将搜索词放在括号中(war|fighting|etc){2,},但这只匹配一个订阅项中相同的词。
编辑2:抱歉造成混淆,我对正则表达式等一切都很陌生。事实上:正则表达式查询一个MySQL数据库。它在tt-rss后端作为过滤器输入,只允许一行(尽管理论上可以无限制输入字符)。导入订阅项到MySQL数据库时会使用该过滤器。