这实际上是一个完全有用的问题的副本,其答案(部分)由提问者得出。原标题:“在R中用于文本分析的neuralnet模型的超过512个字符的公式”。他最终解决了问题,尽管他给出的推理是不正确的,并且通过删除问题并使评论和解决方案不可见而使这个错误更加复杂。
我正在尝试拟合一个神经网络模型,用于将网站分类到两个桶中的一个。训练数据特征是网站上所有链接中的单词,因此例如,一个网站可能具有“主页”,“关于”,“联系人”,“产品”等功能。数据结构化为一个包含类列以及每个训练中单词的列的数据帧。每行都具有类别(合格或不合格)和在该网站上出现的每个单词的0和1。
出现相当数量次数的单词总列表约为1000个,我想使用它们作为功能。但是,公式似乎存在225个字符的限制,因此我无法这样做。
我没有一个好的数据集来给出可重复的输出,但这里是我的代码和我得到的错误。
如果我尝试进行公式,则会被截断:
使用as.formula时也会发生同样的事情:
有什么解决方法吗?
我正在尝试拟合一个神经网络模型,用于将网站分类到两个桶中的一个。训练数据特征是网站上所有链接中的单词,因此例如,一个网站可能具有“主页”,“关于”,“联系人”,“产品”等功能。数据结构化为一个包含类列以及每个训练中单词的列的数据帧。每行都具有类别(合格或不合格)和在该网站上出现的每个单词的0和1。
出现相当数量次数的单词总列表约为1000个,我想使用它们作为功能。但是,公式似乎存在225个字符的限制,因此我无法这样做。
我没有一个好的数据集来给出可重复的输出,但这里是我的代码和我得到的错误。
如果我尝试进行公式,则会被截断:
nn.model <- neuralnet(paste("class ~ ", paste(clean.features, collapse = "+", sep = "")), data = training.data,
hidden = num.nodes)
)
Error in parse(text = x, keep.source = FALSE) : :2:0: unexpected end of input 1: ranty+recipes+contract+just+inventory+types+working+wine+hampshire+suppliers+rise+body+selection+laurel+trek+arlington+cabinet+citrus+advertisers+rhode+highway+intl+province+jewelers+cycles+wy
使用as.formula时也会发生同样的事情:
f <- as.formula(paste("class ~ ", paste(clean.features, collapse = "+", sep = "")))
Error in parse(text = x, keep.source = FALSE) : :2:0: unexpected end of input 1: ranty+recipes+contract+just+inventory+types+working+wine+hampshire+suppliers+rise+body+selection+laurel+trek+arlington+cabinet+citrus+advertisers+rhode+highway+intl+province+jewelers+cycles+wy
如果我尝试使用数据集中的所有功能,它会显示没有“data”参数(即使有):
nn.model <- neuralnet(class ~ . , data = training.data,
hidden = num.nodes, 0))
)
Error in terms.formula(formula) : '.' in formula and no 'data' argument
> sessionInfo()
R version 3.3.2 (2016-10-31) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows >= 8 x64 (build 9200)
有什么解决方法吗?