我需要从一段文本中提取包含特定单词的超链接。例如:
“这是一段带有指向某个页面的链接的文本。单击此链接这是没有在url中包含单词“specificword”的链接”
所以,我需要解析这段文本,检查超链接是否包含单词“specificword”,然后提取整个超链接。然后我将得到以下结果:
我需要一个超链接,它在url中具有特定的单词,例如/server/specificword.htm,而不是在链接文本中。
我尝试过的一个正则表达式是:
此外,我也尝试了这个正则表达式,但它什么也没有匹配到:
“这是一段带有指向某个页面的链接的文本。单击此链接这是没有在url中包含单词“specificword”的链接”
所以,我需要解析这段文本,检查超链接是否包含单词“specificword”,然后提取整个超链接。然后我将得到以下结果:
<a href="/server/specificword.htm>this is a link to a page</a>
我需要一个超链接,它在url中具有特定的单词,例如/server/specificword.htm,而不是在链接文本中。
我尝试过的一个正则表达式是:
/(<a[^>]*>.*?</a>)|specificword/
。这将匹配文本中的所有超链接或"specificword"。如果文本中有多个链接,但没有单词"specificword",我也会得到那些链接。此外,我也尝试了这个正则表达式,但它什么也没有匹配到:
<a.*?href\s*=\s*["\']([^"\'>]*specificword[^"\'>]*)["\'][^>]*>.*?<\/a>
我的正则表达式技能到此为止了,任何帮助都将是极好的...
>
前面是否有引号?还是确实缺失了? - nhahtdh