我有一个关于R中自然语言处理的问题。我的数据非常大,因此我需要将我的数据缩减以进行进一步分析并应用SVM。
我有一个类似于以下的文档-词条矩阵:
Document WordY WordZ WordV WordU WordZZ
1 0 0 0 1 0
2 0 2 1 2 0
3 0 0 1 1 0
在这个例子中,我希望通过删除WordY和WordZZ这两列来减少数据框的大小,因为它们对于这个数据框没有特定的含义。是否可以按照一个特定的顺序删除所有值为零的列?我的问题是,我的数据框太大了,不能用一个命令删除每一列。我的数据框有大约4.0000.0000列。
谢谢大家提前帮助。 祝好, 汤姆
4.0000.0000
中会出现4个零的组合? - Rui Barradas