验证:超越电子邮件地址/电话号码

9
几年前,我为一家批发公司开发了一个网站,该公司希望将其在线目录(和批发价格)保密。除了手动审核每个提交的申请外,我真的不知道如何准确地完成这项任务。
在其他需要注册才能访问某些“稍微秘密”的信息的网络项目中(包括新闻界人士和经销商),也出现过这种情况。由于大多数申请都很少实际提交,因此很容易将自动验证表单的任务视为不可能(或者太费力)。
然而,最近注册人数大幅增加,如果有可能的话,自动化这个过程就很有意义。
该网站是用PHP开发的,我尝试了以下方法:
- 根据企业电话号码爬取邓白氏 - 根据电话/地址爬取黄页 - 基本正则表达式
正则表达式只是标准的任何用户验证。爬虫不可靠(并且可能违反条款和条件)。
其他开发人员如何处理企业/新闻验证问题,并如何向客户证明这一点?
非常感谢。

你想要进行什么样的验证?只是确认他们代表一家企业吗? - Michael Petrotta
我认为你应该使用验证来拒绝明显错误的注册,然后让人工检查其余部分。 - Randy the Dev
@Michael Petrotta 没错,是的。我的以前的方法,几乎任何人都可以查找一个企业并通过输入他们的信息获得自动访问权限。还有其他需要验证的信息,比如税号(对于媒体来说可能不清楚)。@Andrew Dunn 我已经有了标准表单验证,过滤掉无意义的数据。 - Mahdi.Montgomery
5个回答

3
一旦您通过人机筛选,您需要找到一种区分仅仅是好奇的非目标访客(比如谚语中的14岁孩子)和那些您想要接受的人的方法。正如其他评论者所说,没有通用的图灵机识别方式,更不用说评估一个自称记者或商人的人是否对您的站点感兴趣了。
您可以考虑提出问题“请简要描述您对[该网站]的兴趣以及您感兴趣的产品或服务的具体方面。”然后开发一些基于经验的启发式自动筛选。首先,将其通过垃圾邮件过滤器运行,然后为关键字打分等。

谢谢Richard。最终,这就是我采取的方法。我在几个领域进行了验证,最终最大可能得分为50分,每个成功(或部分成功)的领域都会增加得分。如果得分>=40分,我会立即给予他们访问权限。其余部分则需要等待人工验证。 - Mahdi.Montgomery

1

这是一个有趣的概念,但许多注册用户仍然使用“mybusiness@hotmail.com”类型的帐户。虽然这可能是我的检查中的一个不错的补充,但也许我需要一个验证点系统。 - Mahdi.Montgomery
是的,但仍然可以检查mybusiness@hotmail.com是否存在于hotmail服务器上,不是吗?使用链接,卢克:p - Rob

0

这似乎只适用于美国政府机构,而不是所有注册企业。我开始觉得(完整的)反向EIN数据库不存在。 - Mahdi.Montgomery

0

为什么不采用众包的解决方案呢?

这听起来可能有些奇怪,但请耐心听我说。他们都有一个共同点,那就是同行业或类似行业的人。因此,要想注册并获得批准,他们需要由已经拥有预先批准访问权限的人“担保”。由于记者很可能认识其他记者,批发商也很可能认识其他批发商,所以一个人只需要注册并请求某人“担保”他们的合法性即可。

当然,具体实现取决于您,您可以设置任何人在账户获批准之前至少需要两个不同的人为他们担保。该系统需要一些初始手动工作,因为您需要手动批准一些人,但随着更多人注册,他们可能会认识已经拥有访问权限的人。随着时间的推移,该系统变得越来越自给自足。

我唯一看到的问题是,如果用户数量很少,而注册的人不认识站点上的其他人,则可能会出现问题。


但对于申请人数较少的情况,人工验证是最好的选择,直到每天的申请量接近验证人员的最大工作能力。使用已验证的申请来开发自动化系统的启发式算法,在每天的申请量相对较小的时候引入自动化系统,以便验证其结果并适当调整其启发式算法。当然,始终对被拒绝的申请(或其中的子集)进行QA检查。 - David Thomas

0

前言:我不是律师也不是电子商务专家。

如果这是一笔国际交易,那么就没有普遍的标准可以参考。此外,您应该避免与许可证正在等待批准或独立所有者不感兴趣的注册机构做生意。只有当自动化所涉及的事物具备普遍标准或单一数据源池时,自动化才能起作用。

如果缺乏这些条件,您需要一份最终用户许可协议(EULA)来解释您的业务政策,并使用户对欺诈性提交行为负责。如果没有EULA,您可以(根据司法管辖区和当地法律)要求客户填写某种宣誓书,并要求他们在账户激活之前将其传真或扫描/电子邮件发送给您。随后,通过电话联系他们的商业电话号码,以确认他们向当地市政委员会、BBB、商务机构或其他当地政府、公共服务或私人组织注册机构提交的注册信息。他们在您网站上注册时提交的联系电话号码、姓名或电子邮件地址只应作为您进行双重检查的内容,而不应作为确定性联系资源。

此外,还可以通过要求客户购买绝对最低限度的一般服务费用(通常为1美元)来进行额外验证。虽然这种信用卡交易并不完全可靠,但它只是用于识别客户。请参考Craigslist、USPS。

我认为我刚刚用“咨询有经验的律师”回答了你的问题。


但它似乎是一个有趣的网络服务,建立起来很不错,不是吗?创建你自己的“通用业务检查引擎”=) - David Thomas
@David Thomas:这完全取决于你所涉及的领域(epa证书、ohs、萨班斯-奥克斯利法或其他当前流行的分类和认证)。如果没有关于OP用户群的任何信息,我会建议找到共同点,如果只有一两个全球机构为所有人提供服务,那么你可以进行查询。否则,地区通常没有普遍性可言。 - bob-the-destroyer
@bob,完全正确。但我的想法是(我没有勇气实施它),如果您收取一小笔注册费来验证业务凭据(短期内仅在一个国家市场上,使用您认为合适的任何手段),然后提供API供其他企业进行检查...听起来很有趣,但会带来巨大的麻烦。 - David Thomas
@bob,我只是在暗示这听起来是个有趣的项目,但肯定不是我会推荐任何理智人尝试的项目。至于众包方面,是的。我只建议使用一个团队,如果该团队直接受雇于开展该项目的企业。虽然我很想相信众包(维基百科尽管有缺陷,但是它是一个很好的模型),但它确实有其不利之处(4chan和匿名是最为人熟知的)。尽管如此,我还不知道已经尝试过了。 - David Thomas
1
@Aditya,说实话,我有点惊讶他们还没有尝试过。虽然我想,鉴于他们已经明确了“可信任”的身份,其中一个受信任的证书颁发机构可能更适合。 - David Thomas
显示剩余4条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接