我有一个字符串,其中包含一些HTML代码,例如:
This is <strong id="c1-id-8">some</strong> <em id="c1-id-9">text</em>
我需要从每个HTML标记中删除
id
属性,但是我对正则表达式毫无经验,所以我在互联网上搜索并编写了此模式:[\s]+id=\".*\"
不幸的是,这并没有像我期望的那样起作用。实际上,我希望正则表达式能够捕获id="
后面跟着任意字符重复任意次数并以最近的双引号终止的内容;在这个例子中,我希望能捕获id="c1-id-8"
和id="c1-id-9"
。
但是相反,该模式返回了子字符串id="c1-id-8">some</strong> <em id="c1-id-9"
,它找到了id="
的第一个出现和最后一个双引号字符的最后一个出现。请问我的模式有什么问题,如何修复呢? 非常感谢