谷歌搜索结果中的真实文件链接?

89

我经常使用谷歌搜索文档(主要是PDF文件)。但是当我右键单击链接或只是将鼠标光标悬停在上面时,我得到的不是真实的链接,而是一些长而令人困惑的东西,例如以下内容:

http://www.google.com/url?sa=t&source=web&cd=1&ved=0CCUQFjAA&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf&ei=Fai1TZq-Acugtgenw6DqDg&usg=AFQjCNFzYOTqpf68rQnuwW9K7wp39WL6Rg&sig2=z4RqvOLEEJsPohBqr1ghxQ

我不知道这是什么,但我知道这个无用的结果不是我想要的,我想要真正的链接(对于上面的链接:http://www.marxists.org/reference/archive/einstein/works/1910s/relative/relativity.pdf),而不是带有Google干预的东西。

如何从Google搜索结果中获取“真正”的文件链接?


当您单击链接时,Google会进行一些魔法:onmousedown="return clk(this.href,'','','','1','','0CCMQFjAA')" - Blender
只需采用Blender的解决方案,否则你可能会无故浪费时间。 - Null Head
6
这个问题似乎不适合此处,因为它与编程无关。也许您可以到Web Apps Stack Exchange提问。 (顺便说一句,这是一个好问题。我不想投下关闭票,也感到有点烦)。 - jww
还可以在多个浏览器上使用插件或附加组件来解决此问题,具体方法可以参考以下链接:http://www.makeuseof.com/tag/copy-crapfree-urls-googles-search-results/ - Abel
1
我使用这个Chrome扩展程序:https://chrome.google.com/webstore/detail/dont-track-me-google/gdbofhhdmcladcmmfjolgndfkpobecpg - Venryx
10个回答

55

也许这不是最好的解决方案,但这是一种不需要编码或Chrome和Firefox的附加组件的方法。假设有类似的方法可以在IE和其他浏览器中实现,尽管至少IE通常会在浏览器中打开PDF文件,并在顶部的url栏中显示链接,易于复制。

  1. 单击搜索结果,应该会下载PDF文件。

  2. 现在在您的浏览器中打开最近下载列表

  • Chrome:Ctrl + J
  • Linux上的Firefox(?): Ctrl + Shift + Y
  1. 现在复制链接
  • Chrome:右键单击文件名下面列出的URL,选择“复制链接地址”
  • Firefox:右键单击文件并选择“复制下载链接”

编辑:自2020年12月起,Chrome在搜索结果中显示干净的可复制URL。


+1 这实际上是我95%使用情况下的最佳解决方案,我会在自己阅读完文档后将文档URL发送给其他人。 - Michael Hoffman

31

我创建了一个简单的网站,清理谷歌搜索结果的URL:

URL Clean

从谷歌搜索结果中复制的URL(如PDF链接)比它们需要的更加复杂。这个工具会移除不必要的部分,保留页面原始的URL。


2
谢谢!其他的解决方案都是针对桌面的。我当时在打电话。 - worldsayshi
这是最好的答案! - John
@james-trimble 真正的英雄! - stackprotector

18

从@Blender答案的comment中,我学会了如何在Firefox和Chrome中安装用户脚本

现在,在谷歌搜索结果中右键点击并复制URL时,我得到的是真实链接,而不是那些垃圾(抱歉,谷歌,我知道你爱我们,但我们不需要那些臭名昭著的跟踪URL)

起初,我使用了@naxa建议的googlePrivacy,但现在它有点问题。在Web应用程序SE提供的脚本Turning off Google search results indirection可以解决这个问题。它有用户脚本和扩展两种版本:

以下是如何使用用户脚本的信息。

安装用户脚本

在Chrome浏览器中,我使用Tampermonkey进行安装。

tampermonkey

还有 Firefox 中的 Greasemonkey

greasemonkey

结果

用户脚本之前

ugly google

之后

cool google


Web应用相关文章:


2
不需要TamperMonkey,只需在Chrome Web Store中安装“不要跟踪我Google”,非常好。现在为我的PC上的所有其他浏览器做同样的事情 :) 这对于优秀的Opera浏览器有效:https://addons.opera.com/en/extensions/details/remove-google-redirects/我正在寻找适用于所有搜索结果链接的解决方案,而不仅仅是下载链接,因为重定向肯定会延迟您的浏览器,并且有时会完全挂起 :/ - Henrik Erlandsson

10

链接就在这里:

&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf

只需使用一些编程语言,如Python,对其进行反转义:

>>> import urllib
>>> print urllib.unquote('http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf')
http://www.marxists.org/reference/archive/einstein/works/1910s/relative/relativity.pdf

以下是从 Google URL 中提取 URL 的脚本:

import urllib

url = raw_input('What is the Google url? ')
url = url[url.find('&url=') + 5:]
url = url[:url.find('&')]

print urllib.unquote(url)

谢谢,但我想留在我的浏览器内...这个“真实”的URL并不是为了编程目的,只是要复制和粘贴作为我下载的PDF文件的一些信息。 - mayasky
1
你可以将它转换成用户脚本... - Blender
人们已经做过了,例如:http://userscripts.org/scripts/show/29078。顺便说一句,如果你不打算编写用户脚本,你可以在面向电脑高手的Superuser.com上提出这个问题,而不是在面向程序员的stackoverflow.com上提问。有关其他感兴趣的Google相关用户脚本,请参见http://userscripts.org/tags/google?sort=rating。 - n611x007
@naxa,非常感谢你的提示!我在这个帖子里编写了一个答案 ;) - brasofilo

7

+1 给指向这个优秀的扩展的点赞 - Mohammad
我是Firefox用户。这太完美了!我已经注意到Google搜索结果中的这种行为多年了,但不确定是否值得花时间去调查/修复。 - Wally
太棒了!非常感谢。 - Primo Petri

3

我在谷歌上搜索时发现了 Firefox 插件叫做LinkWalker

这是一个简单的上下文菜单实用工具,可以解码嵌入和隐藏的 URL,去除查询字符串参数并将文本选择转换为可点击的链接。

听起来似乎可以解决问题。


2

这是一个很长的链接,因为Google希望跟踪谁发现了什么,并实际点击了搜索结果...

如果你想要真正的链接(上面也是一个真正的链接!)

在你的链接提示符上输入以下内容:

php -r "print urldecode('http://www.google.com/url?sa=t&source=web&cd=1&ved=0CCUQFjAA&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf&ei=Fai1TZq-Acugtgenw6DqDg&usg=AFQjCNFzYOTqpf68rQnuwW9K7wp39WL6Rg&sig2=z4RqvOLEEJsPohBqr1ghxQ');" | awk -F'&' '/url=/{ print $5 }'

1
谷歌想要很多对谷歌有好处的东西。 - Henrik Erlandsson
认真地说,这在几年前根本不是问题。谷歌真的停止做无恶之事了... - Jakob

1

当我在Internet Explorer中查找此搜索时,确实会得到此链接

但是当我使用Chrome时,我得到了你想要的结果。因此,这似乎是一个IE功能,或者至少与您正在使用的浏览器有关。如果您有更换浏览器的可能性,我建议您考虑使用Chrome(已测试,可以得到正常的URL)或Opera(已测试,可以得到正常的URL),但不要使用Firefox(已测试,会给出奇怪的URL)


我必须继续使用Firefox,因为我想使用Zotero(一个优秀的引用管理器),但它只存在于FireFox附加组件中。我也经常使用Chrome,但我的Chrome给出了同样冗长无用的URL。似乎无论是google.com还是google.cn,你得到的URL都有所不同。我想知道幕后发生了什么,但现在我必须暂时采取一些迂回的方法。 - mayasky
Chrome 对我也不起作用。 - Brian Neal
这不是IE的功能。它存在于IE,FF,Opera和Chrome中。我不记得在Mac上的Safari中看到它,但我回到工作时可以检查一下。 - Henrik Erlandsson

0

-3

我曾经也有同样的困扰,我记得有一次阅读到它只会掩盖实际的URL,仅当您登录到您的Google帐户并且您的帐户设置已配置为Web历史记录跟踪时。

如果我没记错的话,您可以尝试以下方法: - 在使用浏览器本机的“隐私”或“无痕浏览”功能的单独浏览器窗口中执行搜索 - 简单地退出您的Google帐户,获取您的结果,然后重新登录 - 转到google.com/history并单击“暂停”,这将防止将来的Web活动被保存,然后在获取结果后返回到相同的页面并单击“恢复”(如果您打算使用Web历史记录)。

如果这种活动是您通常想要从结果中获取多个URL的情况,并且上述技术不起作用,您可以尝试像Firefox的附加组件Copy Link URL这样的东西,它提供了选择链接的能力,然后您可以将其粘贴到文本编辑器中并使用查找和替换替换编码元素。

或者,你可以进行一些研究,找到一个能够为你解码URL的网站。我在webtoolhub.com上找到了URL Deobfuscator,它通过解码编码字符、删除查询字符串等方式,很好地完成了使主要/所需URL可供复制/粘贴的工作。

干杯。


第一段是不正确的,可以在几秒钟内进行检查。 - Henrik Erlandsson

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接