我正在尝试将一个大型制表符分隔的文件读入R。
首先我尝试了这个:
data <- read.table("data.csv", sep="\t")
但它将一些数字变量读取为因子
所以我尝试根据每个变量想要的类型来读取数据,像这样:
data <- read.table("data.csv", sep="\t", colClasses=c("character","numeric","numeric","character","boolean","numeric"))
但是当我尝试这样做时,它会给我一个错误:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan()期望得到“一个实数”,但却得到了“'4'”
我认为原始文件中某些数字值周围有引号可能是原因之一,但我不确定。
sed -i s/\"//g filename
可以删除所有的"
符号。但这可能不是你想要的... - Justin