这是我正在尝试解析的Twitter消息(正如您所看到的,其中一些不是标签,而只是URL的一部分):
#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John
Nack on &#Adobe: Information about Photoshop© CS3 on Snow Leopard
#fail #design</pre>
这是我目前的正则表达式,但它仍然会捕获一些url标签:
[##]+([A-Za-z0-9-_]+)