我正在尝试制作一个表达式,它可以搜索像how2bypass.co.cc这样的页面,并返回“form”标记中“action”属性以及任何输入标记中“name”和“type”属性的内容。我无法使用html解析器,因为我的最终目标是自动检测给定页面是否为Web代理,一旦网站发现我在做这个,他们可能会做一些傻事,比如用javascript编写整个文档,以防止我解析它。
我正在使用的代码:
我正在使用的代码:
preg_match_all('/<form.*action\="(.*?)".*>[^<]*<input.*type\=/i', $pageContents, $inputMatches);
对于 action 属性,这样做可以正常工作,但是一旦在 type\= 后面加上双引号后,代码就停止工作了。为什么会这样?它只能正常工作一次,但第二次就不行了。