假设我有一个看起来像这样的 csv 文件:
Type,ID,NAME,CONTENT,RESPONSE,GRADE,SOURCE
A,3,"","I have comma, ha!",I have open double quotes",A,""
期望的输出应该是:
df <- data.frame(Type='A',ID=3, NAME=NA, CONTENT='I have comma, ha!',
RESPONSE='I have open double quotes\"', GRADE=A, SOURCE=NA)
df
Type ID NAME CONTENT RESPONSE GRADE SOURCE
1 A 3 NA I have comma, ha! I have open double quotes" A NA
我尝试使用read.csv
,因为数据提供者在字符串中使用引号转义逗号,但他们忘记了在没有逗号的字符串中转义双引号,所以无论我是否在read.csv
中禁用引号,都无法获得期望的输出。
有什么办法可以在R中解决这个问题?其他包的解决方案也可以考虑。
read.csv("data.csv", quote='', sep=',')
不能正常工作,因为“content”列会出错。read.csv("data.csv", quote='')
也不能正常工作,因为列没有被正确分隔。 - nathanesau