9得票1回答
使用R从TripAdvisor网站上爬取数据

我想创建一个爬虫,从Trip Advisor上抓取一些数据。理想情况下,它将(a)识别所有要爬行的位置链接, (b)收集每个位置的所有景点链接,以及 (c)将收集所有评论的目的地名称、日期和评分。 我现在想重点关注(a)部分。 这是我开始使用的网站: http://www.tripadvis...

9得票1回答
在并行环境下运行RSelenium

我该如何并行运行RSelenium? 下面是一个使用rvest并行的例子。 library(RSelenium) library(rvest) library(magrittr) library(foreach) library(doParallel) URLsPar <- c("...

9得票2回答
R - 等待PhantomJS加载页面的RSelenium

我制作了一个简陋的网络爬虫,从Expedia网站上爬取价格和航空公司信息: # Start the Server rD <- rsDriver(browser = "phantomjs", verbose = FALSE) # Assign the client remDr <...

8得票1回答
如何通过xpath来检查一个对象在网页上是否可见?

我正在使用R中的RSelenium包进行网页抓取。有时在加载网页后,需要检查页面上是否可见一个对象。例如: library(RSelenium) #open a browser RSelenium::startServer() remDr <- remoteDriver$new() ...

7得票1回答
当我使用Phantomjs(port = 4567l)时,我遇到了类似于“Error in if (file.access(phantompath, 1) < 0) { : argument is of length zero”的错误,意思是参数长度为零。

我的代码是 library(RSelenium) library(wdman) pDrv &lt;- phantomjs(port = 4567L) 以下是运行上述代码后我得到的错误信息。 checking phantomjs versions: BEGIN: PRED...

7得票1回答
使用Rselenium点击跨域iframe元素

我正在使用版本为3.3.2的R语言,并且使用Rselenium软件包,试图从这个网站中提取一些数据:http://www.dziv.hr/en/e-services/on-line-database-search/patents/ 我正在使用Rselenium,我的代码看起来像这样: se...

7得票2回答
Rselenium 无法连接到正在运行的 shiny 应用程序。

我在docker中配置了selenium服务器。它工作正常-我可以连接到它,但是当我想要与正在运行的本地shiny应用程序进行交互时,Rselenium无法看到它。详情如下: 我按步骤执行: 我运行了selenium服务器: docker run -d -p 4445:4444 sele...

7得票5回答
R: Selenium 服务器提示端口号4567已被占用。

看起来这是一个经常性的问题,但我没有找到解决我的问题的方法。 我正在运行以下内容: link &lt;- 'https://www.google.com/' rD &lt;- rsDriver(verbose = TRUE, port=4567L, ...

7得票3回答
RSelenium:点击不可见对象 - ElementNotVisibleException

这个页面的主菜单(linio)有11个链接。只关心其中9个(灰色背景的并且悬停时显示子菜单的那些)。 我想要点击这9个选项中每个子菜单中的每个元素。期望的流程是: 1.第一部分: "Celulares y Tablets"。 2.进入: "Celulares y Smartphones"。...

7得票1回答
无法在RSelenium中使用phantomjs启动会话

无法使用 rsDriver 启动一个新的 phantomjs 会话。其他浏览器能正常工作,但当我尝试使用 phantomjs 选项时它无法工作,并且我无法完全理解错误输出的含义。我应该如何解决这个问题? require(RSelenium) remDr=rsDriver(port = 446...