这个问题似乎很容易在R中删除字符串中的空格字符。然而,当我加载以下表格时,我无法删除两个数字之间的空格(例如。11 846.4
):
require(XML)
require(RCurl)
require(data.table)
link2fetch = 'https://www.destatis.de/DE/Themen/Branchen-Unternehmen/Landwirtschaft-Forstwirtschaft-Fischerei/Feldfruechte-Gruenland/Tabellen/ackerland-hauptnutzungsarten-kulturarten.html'
theurl = getURL(link2fetch, .opts = list(ssl.verifypeer = FALSE) ) # important!
area_cult10 = readHTMLTable(theurl, stringsAsFactors = FALSE)
area_cult10 = rbindlist(area_cult10)
test = sub(',', '.', area_cult10$V5) # change , to .
test = gsub('(.+)\\s([A-Z]{1})*', '\\1', test) # remove LETTERS
gsub('\\s', '', test[1]) # remove white space?
为什么我不能去除
test[1]
中的空格?
感谢任何建议!这可能是除了空格字符以外的其他东西吗?也许答案很简单,我正在忽略某些事情。
,可以用\u00A0
进行搜索。有些棘手! - andschar[1] "11846.4"
- 没有空格。 - Wiktor Stribiżew[1] "11 846.4"
。不过,我可以使用上述的\u00A0
删除它。或许是因为包版本不同? - andschartest1 <- gsub("[\\sA-Za-z]+", "", area_cult10$V5)
来删除所有的空格和字母,那么空格就会保留下来。而且gsub("[[:space:]A-Za-z]+", "", area_cult10$V5)
是有效的。 - Wiktor Stribiżewsub(",", ".", gsub("[[:space:]A-Za-z]+|\\W+$", "", area_cult10$V5), fixed=TRUE)
。 - Wiktor Stribiżew