我正在使用Python编写xbmc插件。我已经得到了一个字符串列表,格式如下:
现在我想拆分链接和文本。我尝试使用re.compile:
但我得到的只有
我做错了什么?
注意: 我知道我应该regexp html代码,但我不确定这个“规则”是否适用于小字符串。此外,由于某种原因,这几乎是xbmc插件编写的标准,我认为这其中一定有原因。
<a href="/www.link.to/something">链接名称</a>
通过使用Beautiful Stone Soup(代码的相关部分): soup = BeautifulStoneSoup(link, convertEntities=BeautifulStoneSoup.XML_ENTITIES)
programs = soup('ul')
i = 0
for prog in programs:
i = i+1
if i==(5+getLetterValue(name)):
j = 0
while j < len(prog('li')):
li = prog('li')[j]
link = li('a')[0]
getLeterValue
是一个函数,它返回一个索引,该索引指示特定的“ul”标记放置在哪里(根据所需字母)。现在我想拆分链接和文本。我尝试使用re.compile:
match=re.compile('<a href="(.+?)">(.+?)</a>').findall(link.string)
但我得到的只有
match=[]
。我做错了什么?
注意: 我知道我应该regexp html代码,但我不确定这个“规则”是否适用于小字符串。此外,由于某种原因,这几乎是xbmc插件编写的标准,我认为这其中一定有原因。
for i,prog in enumerate(programs):
。 - eyquem