我想知道URL缩短器的工作原理,比如它们如何从地址栏中提取文本并将其映射到正确的URL,然后再进行重定向。它们使用哪种编程语言?它们如何维护映射历史记录?它们如何确保缩短的URL的唯一性?普通人怎样才能在不访问URL的情况下取消缩短的链接?
我刚刚爬取了一堆 Google Buzz 数据,我想知道哪些 Buzz 帖子参考了相同的新闻文章。问题在于这些帖子中的许多链接都被 URL 缩短器修改了,因此很可能许多不同的缩短网址实际上都指向相同的新闻文章。 考虑到我有数百万个帖子,有什么最有效的方法(最好用 Python 实现)可以: ...
我正在学习Python,对于如何实现感兴趣。在寻找答案时,我发现了这个服务:http://www.longurlplease.com 例如: http://bit.ly/rgCbf可以转换为: http://webdesignledger.com/freebies/the-best-so...
我希望创建类似于Tiny URL的链接。我的想法是为每个发布的长链接存储一个递增的标识符,然后将此ID转换为其基数36变体,例如在PHP中执行以下操作: $tinyurl = base_convert($id, 10, 36) 这里的问题在于结果是可猜测的,而下一个url应该很难被猜测到...