在其他需要注册才能访问某些“稍微秘密”的信息的网络项目中(包括新闻界人士和经销商),也出现过这种情况。由于大多数申请都很少实际提交,因此很容易将自动验证表单的任务视为不可能(或者太费力)。
然而,最近注册人数大幅增加,如果有可能的话,自动化这个过程就很有意义。
该网站是用PHP开发的,我尝试了以下方法:
- 根据企业电话号码爬取邓白氏 - 根据电话/地址爬取黄页 - 基本正则表达式
正则表达式只是标准的任何用户验证。爬虫不可靠(并且可能违反条款和条件)。
其他开发人员如何处理企业/新闻验证问题,并如何向客户证明这一点?
非常感谢。