我希望这不是一个 RTFM(阅读完整说明) 的问题。
我正试图编写一个提取标准 HTML 网页中链接的 Python 脚本(
亚当
更新: 实际上,我正在寻找两个不同的答案: 1.解析 HTML 链接的库解决方案。Beautiful Soup 似乎是一个好的解决方案(感谢 Igal Serban 和 cletus!) 2.链接是否可以使用正则表达式定义?
<link href...
标签)。
我在网上搜索匹配的正则表达式,并找到了许多不同的模式。是否有任何一致的、标准的正则表达式可用于匹配链接?亚当
更新: 实际上,我正在寻找两个不同的答案: 1.解析 HTML 链接的库解决方案。Beautiful Soup 似乎是一个好的解决方案(感谢 Igal Serban 和 cletus!) 2.链接是否可以使用正则表达式定义?