我有一个简单的网页爬虫,似乎表现很奇怪:
- 在桌面版的RStudio(在Windows上运行R版本3.3.3)中,它表现如预期,并且产生数字向量。
- 在服务器版的RStudio(在Linux上运行R版本3.4.1)中,
你有任何想法会造成这种差异吗?
- 在桌面版的RStudio(在Windows上运行R版本3.3.3)中,它表现如预期,并且产生数字向量。
- 在服务器版的RStudio(在Linux上运行R版本3.4.1)中,
gsub()
(随后是数字转换)失败,代码产生一组NA
。你有任何想法会造成这种差异吗?
library(rvest)
url <- "http://benzin.impuls.cz/benzin.aspx?strana=3"
impuls <- read_html(url, encoding = "windows-1250")
asdf <- impuls %>%
html_table()
Benzin <- asdf[[1]]$X7
chrBenzin <- gsub("\\sKč","",Benzin) # something is wrong here...
numBenzin <- as.double(chrBenzin)
numBenzin
gsub
的不同变体 - 1)gsub("[[:space:]]*Kč","",Benzin)
,2)gsub("(*UCP)\\s*Kč","",Benzin, perl=TRUE)
。 - Wiktor Stribiżew\\s
不能工作,这让我困惑不解... - Jindra Lacko