在HTML中混淆电子邮件

8

我正在开发一个网站,其中包含一个过滤器,试图混淆它提供的网页中存在的任何电子邮件地址。

目前,它将地址转换为图像。

我也看到了一些其他方法的使用; 一些方法将地址拆分为字符,并使用生成的JavaScript将其包含在最终文档中,但这需要JavaScript,所以在我看来并不是那么有用。好处是可以用于创建工作的mailto链接。

另一种方法与上述方法非常相似,使用十六进制符号标记电子邮件地址。然而,我不太确信它是否能防止任何严重的信息收集者。

其他人利用人类大脑理解语言的能力,要么替换@符号等字符为单词,要么分离主机和用户名等。

我的问题是,当我在图像中没有对文字进行任何扭曲时,使用生成的图像(文件名不会透露地址)对抗爬虫程序的可靠性如何?我应该选择不同的方法吗?

作为继续:如果我希望有一个备选方法,以防图像创建出现问题,哪种方法是最明智的?


你是列出你的电子邮件地址还是列出用户的电子邮件? - Elizabeth Buckwalter
我正在列出一些与运营网站的协会相关的电子邮件,可能会包含用户生成的内容,其中可能包含电子邮件地址。 - nikc.org
6个回答

14

这里有很多电子邮件地址混淆的方法以及它们的有效性。

希望对你有所帮助!


2
我喜欢使用从右到左的文本的简洁性,但缺点是从浏览器复制电子邮件时可能会感到沮丧。不过第二种方法似乎是一个绝妙的选择。 - nikc.org

2
我的问题是,当我在图像中不使用任何文本扭曲时,使用生成的图像(文件名没有地址)对抗网络爬虫的方法有多可靠?
我没有数据来支持这一点,但我会说:非常可靠。使用“传统”方法,收割机可以获得数百万个地址;我认为他们不会为了获得更多的少数地址而进行图像处理,这在经济上不可行。
作为延续:如果我想要一个备用方法,以防万一图像创建因某种原因失败,哪种方法最明智?
使用一个好的垃圾邮件过滤器。 :-) 不,认真地说,很难将电子邮件地址隐藏起来不被收割机发现。

同意,你简单地不能拥有一个电子邮件账户而没有垃圾邮件过滤器。但是减轻它们的工作量也是一个值得追求的目标 :-) - nikc.org

1

一种可能性是继续使用图像,但如果启用了JavaScript,则将其替换为文本和mailto链接。


0
只要您不将图像命名为明显的名称,比如emailadress.png,那么您应该是相当安全的 - 我想。

0

我认为重点在于在显示电子邮件之前提供某种'人机验证测试',或以测试本身的方式显示电子邮件。

沿着同样的思路,也许提供一个链接作为电子邮件地址,并在显示电子邮件之前运行测试可能也是一种解决方案。


当电子邮件地址应该对所有访问者可见时,这并不是一个可行的选择。例如,在页脚中的联系地址。 - nikc.org

0
作为用户,一个图像混淆的电子邮件地址几乎和没有电子邮件地址一样无用。无论您选择哪种方法,我理想情况下应该得到一个mailto链接,次优选项是某种形式的your.name.69 AT longwebsitewhosnameicanteasilytranscribe.net风格的地址。

是的,我同意用图像替换电子邮件地址很糟糕,因为你无法复制文本。但这个世界很糟糕,我们必须尽一切努力减少所需的铲除工作。 - nikc.org
2
开发人员必须尽其所能减少重复劳动。用户只需坐下来享受无粪便草坪的乐趣。 :-) - kubi

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接