我正在使用re.findall()从HTML文件中提取一些版本号:
>>> import re
>>> text = "<table><td><a href=\"url\">Test0.2.1.zip</a></td><td>Test0.2.1</td></table> Test0.2.1"
>>> re.findall("Test([\.0-9]*)", text)
['0.2.1.', '0.2.1', '0.2.1']
但我只想得到那些没有以句点结尾的。
文件名可能不总是以 .zip 结尾,所以我不能只在正则表达式中添加 .zip。
最终想得到的结果是:
['0.2.1', '0.2.1']
有人能建议一个更好的正则表达式来使用吗? :)