14得票1回答
RSelenium中的下拉框

如何在 RSelenium 中与下拉框进行交互?特别是,我可以使用findElement选择下拉框,但如何使用它来选择一个选项?

14得票2回答
使用R语言向在线表单添加字段并抓取生成的JavaScript表格

我想让R自动填写网页http://cti.voa.gov.uk/cti/上的“按邮编搜索”栏位,并预设文本(例如BN1 1NA),然后进入下一页并爬取结果中的4列表格,这取决于邮编,可能跨越多个页面。更复杂的是,“改进指标”不是一个文本字段,而是一个图像文件(如果您使用邮编BN1 3HP进行搜...

13得票2回答
如何使用Rselenium读取HTML表格?

我正在使用Rselenium导航到一个网页。以下代码可以实现此操作。我没有提供网址,因为我在一家需要VPN连接的公司中使用它:RSelenium::startServer() require(RSelenium) remDr <- remoteDriver() remDr$navigat...

12得票1回答
文档深度过深:在R中使用xml2::read_html()的XML_PARSE_HUGE选项

首先,我想为一个新问题道歉,因为我的个人资料还不允许我评论其他人的评论,特别是在我看到的两篇SO文章上。请耐心等待这位老年人:-) 我正在尝试读取100个字符文件列表,大小从约90KB到2MB不等,然后使用qdap包对我从文件中提取的文本进行一些统计,即计算句子、单词等。这些文件包含以前使用...

11得票3回答
使用R语言爬取带有搜索功能的包含ASP、JavaScript和分页表格的页面

我正在尝试使用rvest或RSelenium获取 https://www.askebsa.dol.gov/epds/default.asp 上的内容,但在 JavaScript 页面从搜索框开始时找不到指导?希望能将所有这些内容简单地放入 CSV 文件中。 此后,似乎可以从像 https:/...

11得票3回答
在RSelenium中指定下载文件夹

我正在使用RSelenium浏览网页,其中包含一个下载文件的按钮。我使用RSelenium点击此按钮以下载文件。但是,默认情况下,文件会下载到我的“下载”文件夹中,而我希望文件下载到我的工作目录中。我尝试如下指定Chrome配置文件,但这似乎不能完成任务:wd <- getwd() cp...

10得票1回答
卡在如何使用R从该网站上爬取数据这一问题上了。

我正在尝试使用R从此网站中爬取数据:http://www.soccer24.com/kosovo/superliga/results/#我可以执行以下操作:library(rvest) doc <- html("http://www.soccer24.com/kosovo/superli...

10得票1回答
如何使用RSelenium打开Google Chrome?

我正在使用RSelenium,并且希望打开和浏览Google Chrome。然而,每次我想从R中打开浏览器时都会出现错误。以下代码被使用:library("RSelenium") startServer() mybrowser <- remoteDriver(browserName = ...

10得票4回答
如何在网上填写表格并在R中获取结果

有没有人曾经从R远程填写网页表单? 我想使用我的得分在R中进行一些射箭统计。有一个非常方便的网页,可以给出分类和障碍等级 http://www.archersmate.co.uk/,我自然希望将其包含在我的统计表中。 是否可能远程填写此表格并将结果返回到R? 否则,我将不得不将所有障碍等...

10得票1回答
在R中爬取密码保护的论坛

我在我的脚本中登录时遇到了问题。尽管我在stackoverflow上找到了其他好的答案,但没有一个解决方案适用于我。 我正在为我的博士研究爬取一个Web论坛,其网址是http://forum.axishistory.com。 我想要爬取的网页是会员名单 - 列出所有会员资料页面的链接的页面...