我想读取的数据集包含有逗号作为千位分隔符和没有逗号的数字:
"Sudan", "15,276,000", "14,098,000", "13,509,000"
"Chad", 209000, 196000, 190000
我正在寻找一种读取这些数据的方法。
任何提示都会受到赞赏!
由于问题下有一个“r”标签,我认为这是一个R语言的问题。在R中,您不需要做任何处理来处理引号内的逗号:
> read.csv('t.csv', header=F)
V1 V2 V3 V4
1 Sudan 15,276,000 14,098,000 13,509,000
2 Chad 209000 196000 190000
# if you want to convert them to numbers:
> df <- read.csv('t.csv', header=F, stringsAsFactor=F)
> df$V2 <- as.numeric(gsub(',', '', df$V2))
看着那组数据,你可以使用", "(注意多余的空格)作为分隔符,而不是","来解析它。
,(?=[0-9])|"
然后像平常一样处理它