Googlesearch结果中的“真实”链接到文件?

我经常使用Googlesearch文档(主要是PDF)。 但是,当我右键单击链接,或者只是将鼠标hover在它上面。 我得到的并不是真正的联系,但有些事情很长,而且像以下这样混乱:

http://www.google.com/url?sa=t&source=web&cd=1&ved=0CCUQFjAA&url=reference/archive/einstein/works/1910s/relative/relativity.pdf&ei=Fai1TZq-Acugtgenw6DqDg&usg=AFQjCNFzYOTqpf68rQnuwW9K7wp39WL6Rg&sig2=z4RqvOLEEJsPohBqr1ghxQ 

我不知道这是什么,但我知道这个废话不是我想要的,我想要真正的链接(对于上面的那个: reference/archive/einstein/works/1910s/relative/relativity.pdfreference/archive/einstein/works/1910s/relative/relativity.pdf ),而不是Google的干预。

如何获得Googlesearch结果中的“真实”链接?

也许这不是最好的解决scheme,但是这里有一种不需要Chrome和Firefox编码或附件的方法。 假设对于IE和其他浏览器也有类似的方法,尽pipe至lessIE浏览器通常会在浏览器中打开PDF文件,其顶部的url栏中的链接很容易复制。

  1. 点击search结果,下载PDF。

  2. 现在在浏览器中打开最近的下载列表

    • Chrome,Ctrl + J
    • Linux上的Firefox(?),它是Ctrl + Shift + Y
  3. 现在复制链接

    • Chrome浏览器:右键单击文件名称下方的URL,然后select“复制链接地址”
    • Firefox:右键单击文件并select“复制下载链接”

我创build了一个清理Googlesearch结果url的简单网站:

URL清理

从Googlesearch结果复制的url(例如指向PDF的链接)比他们需要的要复杂得多。 这个工具删除不必要的部分,留下页面的原始URL。

从@Blender的回答中,我学习了如何在Firefox和Chrome中安装用户脚本

现在,当在Googlesearch结果中右键点击并复制一个url时,我会得到真正的链接而不是垃圾(对不起,Google,我知道你爱我们,但是我们并不需要臭屁的跟踪URL)

起初,我用@naxabuild议使用googlePrivacy,但是它现在正在窃听。 在Web Applicatations SE中提供的脚本, 将Googlesearch结果间接closures ,可以完成这项工作。 它具有用户脚本和扩展口味:

  • 在Chrome网上应用店中“不要跟踪我的谷歌” 。
  • 在Userscripts.org上, “不要跟踪我的谷歌”

贝娄有关如何进行用户脚本的信息。

安装UserScript

在Chrome中,我使用Tampermonkey进行安装。

tampermonkey

和Firefox中的Greasemonkey 。

Greasemonkey的

结果

在UserScript之前

丑陋的谷歌

很酷的谷歌


Web应用程序中的相关文章:

  • 如何让Googlesearch不redirect

url就在这里:

 &url=reference/archive/einstein/works/1910s/relative/relativity.pdf 

只要用Python这样的语言来隐藏它即可:

 >>> import urllib >>> print urllib.unquote('reference/archive/einstein/works/1910s/relative/relativity.pdf') reference/archive/einstein/works/1910s/relative/relativity.pdf 

所以要从Googleurl中提取url,请使用以下脚本:

 import urllib url = raw_input('What is the Google url? ') url = url[url.find('&url=') + 5:] url = url[:url.find('&')] print urllib.unquote(url) 

做一个小小的谷歌search,并跑过名为LinkWalker的Firefox加载

简单的上下文菜单实用工具,用于解码embedded和隐藏的URL的链接,剥离查询string参数并将文本select转换为可点击的链接。

听起来这样可以做到这一点。

我使用的是一个名为Google / Yandexsearch链接修复的Firefox扩展,它的工作原理非常好,可以直接复制链接目标

当我在Internet Explorer中查找这个search时 ,我确实得到了这个链接

但是,当我使用Chrome,我得到你想要的。 所以它似乎是一个IEfunction,或者至less有一些与你使用的浏览器有关。 如果你是在改变浏览器的位置,我会考虑使用铬(testing,给出正常的URL)或歌剧(testing,正常的url),而不是火狐(testing,给出时髦的url)

这是一个很长的链接,因为谷歌想跟踪谁发现了什么,并实际上点击search结果…

如果你想要真正的链接(以上也是一个真正的链接!)

在你的linkx-prompt中input:

 php -r "print urldecode('http://www.google.com/url?sa=t&source=web&cd=1&ved=0CCUQFjAA&url=reference/archive/einstein/works/1910s/relative/relativity.pdf&ei=Fai1TZq-Acugtgenw6DqDg&usg=AFQjCNFzYOTqpf68rQnuwW9K7wp39WL6Rg&sig2=z4RqvOLEEJsPohBqr1ghxQ');" | awk -F'&' '/url=/{ print $5 }' 

看到这个工具

http://www.duvidasdeinformatica.com/blog/limpar-links-paginas-resultados-google/

这是在葡萄牙语,但在底部有一个框,您可以复制/粘贴的url,它得到的“转换”为真正的一个…

我想我曾经阅读过一次,虽然有同样的沮丧, 只有当你login到你的谷歌帐户,你的帐户设置configuration为networking历史logging跟踪,它掩盖了实际的url。

如果我的记忆正确地为我服务,您可以尝试: – 使用浏览器原生的“私人”或“隐身”浏览function在单独的浏览器窗口中执行search – 只需登出您的Google帐户,获取结果并重新login即可 – 请前往google.com/history并点击“暂停”,以防止未来的网页活动被保存,然后在抓取结果后点击“恢复”(如果您打算使用networking历史logging)返回到同一页面。

如果这种活动是你经常想从结果中抓取多个url的东西,而且我记得上面的技术不起作用,那么你可以尝试一些类似于Firefox的附加组件,比如Copy Link URL提供复制您select的链接的URL的function,然后您可以将其粘贴到文本编辑器中,并使用“查找和replace”replace已编码的元素。

或者,你也许可以做一些研究来find一个能够解码你的URL的网站。 我在webtoolhub.com网站上find了Deobfuscator的URL,通过对编码后的字符进行解码,删除查询string等,使得主/期望的URL可用于复制/粘贴。

干杯。