我有一个自动化任务,需要将一些表单填写在一个网站上,这些表单的数据来自于word文档。为此,我需要一个模拟浏览器的库,可以让我编程进入网站并访问html元素。这个叫什么?有没有python或clojure的库可以实现这个功能的例子?
我有一个自动化任务,需要将一些表单填写在一个网站上,这些表单的数据来自于word文档。为此,我需要一个模拟浏览器的库,可以让我编程进入网站并访问html元素。这个叫什么?有没有python或clojure的库可以实现这个功能的例子?
在当今的Clojure中,http-kit是我最喜欢的。它使得HTTP交互变得非常简单。
; taken from github
(defn on-response [resp]
;; {:status 200 :body "....." :headers {:key val :key val}}
(println resp))
;;; initialize, timeout is 40s, and default user-agent
(http/init :timeout 40000 :user-agent "http-kit/1.1")
;;; other params :headers :proxy binary? keyify?
(http/get {:url "http://shenfeng.me" :cb on-response})
;;; other params :headers :proxy binary? keyify?
(http/post {:url "http://example/"
:cb on-response
:body {"name" "http-kit" "author" "shenfeng"} :binary? true})
我也使用过CasperJs,它可以让任何无头浏览成为可能。此外,在自动化浏览时,您可以与客户端JavaScript进行交互。 我发现唯一的缺点是将所有这些与现有代码集成起来稍微有些困难,但作为独立工具,它非常完美。它还支持coffescript和javascript脚本。
查看Quickstart以了解其工作原理。