我需要一个正则表达式,它可以返回被双引号包含的特定文本块开始,并以指定文件扩展名(如.txt)结尾的文本内容。我使用urllib2获取页面的html(该html非常简单)。
基本上,如果我有像这样的东西
<tr>
<td valign="top"><img src="/icons/unknown.gif" alt="[ ]"></td>
<td><a href="Client-8.txt">new_Client-8.txt</a></td>
<td align="right">27-Jun-2012 18:02 </td>
</tr>
它应该只是返回给我。
Client-8.txt
返回值包含在双引号内。我知道文件名以“Client-”开头,文件扩展名为“.txt”。
我正在使用r.search(regex, string)进行尝试,其中输入的字符串是页面的HTML。但我对正则表达式不熟悉。
谢谢!