使用wget爬取带有rel="nofollow"的链接

Question

5

我有一个网站 (http://a-site.com)，里面有许多类似的链接。我该如何使用wget来抓取并筛选出这些链接，并将它们保存到一个文件中?

<a href="/user/333333/follow_user" class="btn" rel="nofollow">Follow</a>

我尝试过这个命令，但是它无法获取nofollow链接。

$ wget --no-verbose -r -l1 http://a-site.com 2>&1

- angelokh

黑客解决方案 - 打开wget源代码并搜索和破解“nofollow”字符串。 - Nick

是否有其他工具可以允许nofollow链接？ - angelokh

我不知道，我们曾经使用Lynx实现过类似的功能。 - Nick

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Nick · Accepted Answer

这里的信息：

尝试：

wget -erobots=off http://your.site.here