无法执行rsDriver(连接被拒绝)

32

我无法使用R selenium,以下是第一步和我的输出:

library(RSelenium)
rD <- rsDriver()
# checking Selenium Server versions:
#   BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# checking chromedriver versions:
#   BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# checking geckodriver versions:
#   BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# checking phantomjs versions:
#   BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# [1] "Connecting to remote server"
# Error in checkError(res) : 
#   Undefined error in httr call. httr output: Failed to connect to localhost port 4567: Connection refused
# In addition: Warning message:
#   In rsDriver() : Could not determine server status.

我错过了什么?

5个回答

39

注意:这个答案是针对 Windows 系统的。

当尝试运行已弃用的 checkForServer() 方法时,Selenium 提供了两个选项:

  • 使用 rsDriver
  • 使用 Docker

参见:

RSelenium::checkForServer()
# Error: checkForServer is now defunct. Users in future can find the function in 
# file.path(find.package("RSelenium"), "examples/serverUtils"). The
# recommended way to run a selenium server is via Docker. Alternatively
# see the RSelenium::rsDriver function.

似乎每个人 都遇到了 rsDriver的问题,而Docker是推荐的选择,所以我们将采用这种方式:

  • 安装Docker
  • 运行它,并按请求重启计算机
  • 通过在命令行中运行docker pull selenium/standalone-firefox(或chrome代替firefox)或在R中运行shell('docker pull selenium/standalone-firefox')拉取镜像
  • 通过在命令行中运行docker run -d -p 4445:4444 selenium/standalone-firefox或在R中运行shell('docker run -d -p 4445:4444 selenium/standalone-firefox')启动服务器
  • 然后运行remDr <- remoteDriver(remoteServerAddr = "localhost", port = 4445L, browserName = "firefox'")。文档建议使用虚拟机,但我无法使其工作。

有了这个,我可以开始编写代码:

shell('docker run -d -p 4445:4444 selenium/standalone-firefox')
remDr <- remoteDriver(remoteServerAddr = "localhost", port = 4445L, browserName = "firefox")
remDr$open()
remDr$navigate("http://www.google.com/ncr")
remDr$getTitle()
# [[1]]
# [1] "Google" 

更多信息请参考文档:


1
有没有类似的教程可以指导如何在Mac上开始使用RSelenium? - MLEN
您已经使用了相同的命令来拉取镜像和启动服务器:docker run -d -p 4445:4444 selenium/standalone-firefox。第一个命令不应该是 docker pull 的调用吗?(尽管对于这两个任务都使用相同的命令也可以工作,因为 docker run 会在本地没有可用的镜像时拉取它)。 - Frank Schmitt
你说得对,弗兰克。我犯了一个复制粘贴的错误,现在已经修复了,谢谢。我还统一了firefoxchrome的使用,因为之前有些不明确的地方。 - moodymudskipper
1
这是否意味着您正在Docker内部运行RSelenium? - QHarr
3
当我运行这段代码时,出现了以下错误:“httr调用中发生未定义的错误。httr输出:连接本地主机端口4445失败:连接被拒绝。” - Nathan123
显示剩余5条评论

23

使用RSelenium/rsDriver一段时间后,我最近遇到了一个与原帖非常相似的错误消息,但由于组织上的原因,无法使用Docker来解决。以下是我解决它的方法:

查看函数文档后发现,默认情况下rsDriver()配置为使用最新版本的Chrome和Firefox(Gecko)驱动程序启动Selenium服务器,即使您已指定要运行的其他浏览器也是如此。在我的情况下,我正在指定browser = "firefox",但是最近一次运行时自动下载了一个新的Chrome驱动程序,并且出于某种原因与Selenium无法正常工作。这就是问题的根本原因。

这并不特别直观,而且"Connection refused"的消息并没有真正帮助,但按照错误建议并检查服务器日志让我意识到,即使我使用Firefox,Selenium仍在尝试加载Chrome驱动程序:

rd <- rsDriver(browser = "firefox")
# Yields an error message after doing pre/post downloads:

#> Could not open firefox browser.
#> Client error message:
#> Undefined error in httr call. httr output: Failed to connect to localhost port 4567: Connection refused
#> Check server log for further details.
#> Warning message:
#> In rsDriver(browser = "firefox" :
#>  Could not determine server status.

rd$server$log()

> $stderr
> [1] "Error: Could not find or load main class c(-Dwebdriver.chrome.driver=\"C:\filepath\to\chromedrivers\109.0.5414.25.chromedriver.exe\","

> $stdout
> character(0)

无论如何,如果您指定rsDriver()使用旧版本的驱动程序运行,或者只是传递NULL以便它不查找驱动程序,可能会解决问题(对我有用)。

# Default parameters of the rsDriver() function:

rsDriver(port = 4567L,
         browser = c("chrome", "firefox", "phantomjs", "internet explorer"),
         version = "latest",
         chromever = "latest",
         geckover = "latest",
         iedrver = NULL,
         phantomver = "2.1.1",
         verbose = TRUE,
         check = TRUE,
         ...)

# Specify an older driver version you know works (or just use NULL), 
# even if it doesn't correspond to the browser you're using:

rd <- rsDriver(browser = "firefox",
               chromever = "109.0.5414.25") # alt: chromever = NULL

如果你正在寻找这些驱动程序被RSelenium自动下载时保存的文件路径(例如,也许你想找到旧版本驱动程序的名称),在Windows上,它应该是~/AppData/Local/binman

感谢这个问题上的回答,这也帮助我找到了正确的方向!


3
太棒了!我曾经担心要提出请求才能安装Docker(我的公司在权限方面相当受限)。你的解决方案真是救命稻草!简直不敢相信它会检查Chrome,而我却在使用Firefox XD。 - JRP
3
非常感谢您的回答!我因这个问题而烦恼不已,找不到解决办法。 - U_jex
1
其他人成功的方法:1)删除LICENSE.chromedriver文件和 2)将wdman从版本0.2.6回滚到0.2.5。最终对我有效的方法是更新wdman依赖的所有软件包。看起来我有一些非常旧的软件包,例如yaml和jsonlite,长时间没有更新。一旦我更新了所有这些软件包,rsDriver就又可以工作了。 - Christopher Carroll Smith
2
谢谢你解决了这个问题。我只需要改变的是添加 chromever = NULL - hypothesis
完美,谢谢! - undefined
显示剩余3条评论

4
2023年,我在使用Chrome时遇到了这个错误,解决办法是删除以下目录中的LICENSE.chromedriver文件(适用于Windows 10):

C:\Users\YOURUSERNAME\AppData\Local\binman\binman_chromedriver\win32\114.0.5735.16

或者
C:\Users\YOURUSERNAME\AppData\Local\binman\binman_chromedriver\win32\YOURCHROMEVERSION
我不知道为什么它有效,这是一个YouTuber建议的,但我忘记了他的名字,而且在三次独立安装中都起作用。

4
如果还有用的话,我今天也遇到了同样的问题,通过安装Java开发工具包(Java SE Development Kit 11.0.1)解决了这个问题。
我从电脑上收到了错误消息,并且与此问题中提到的相同的R错误一样,但是这个方法解决了它。
为了得到一个可重现的示例,我能够复制这个tutorial

sessionInfo() R版本3.4.4(2018-03-15) 平台:x86_64-apple-darwin15.6.0(64位) 运行在:macOS High Sierra 10.13.5

Matrix products: default
BLAS: /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/3.4/Resources/lib/libRlapack.dylib

locale:
[1] fr_CA.UTF-8/fr_CA.UTF-8/fr_CA.UTF-8/C/fr_CA.UTF-8/fr_CA.UTF-8

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] RSelenium_1.7.5

loaded via a namespace (and not attached):
[1] Rcpp_0.12.17     XML_3.98-1.11    binman_0.1.1     assertthat_0.2.0 rappdirs_0.3.1   bitops_1.0-6    
[7] R6_2.2.2         jsonlite_1.5     semver_0.2.0     httr_1.3.1       curl_3.2         xml2_1.2.0      
[13] subprocess_0.8.3 tools_3.4.4      wdman_0.2.4      yaml_2.1.18      compiler_3.4.4   caTools_1.17.1  
[19] openssl_1.0.1 

链接的网站无法工作 - 你能在你的回答中添加修复的细节吗? - msm1089
很抱歉,网站已经崩溃了,而且在Wayback机器上似乎没有备份:/ - pollytatouin
啊,真遗憾!另一个教程在 https://joshuamccrain.com/tutorials/web_scraping_R_selenium.html (不过在问题解决之前也没什么用)。对我来说,我通过删除 chromedriver 下载中的许可文件来解决了这个问题。 - msm1089

2
根据Cran文献,我必须运行以下命令:
shell("docker-machine ip")

然后将remoteServerAddr设置为返回的IP地址。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接