当使用下载的R包,例如“tm”时,通常会加载一个示例数据集,例如
data("crude")
我该如何知道这个数据集到底是什么,以及它是矩阵还是向量格式?只有了解这些信息,我才能将我的输入定制为此软件包所需的格式。
除了使用帮助功能获取有关 crude
的更多信息外,我们还可以这样做:
# load crude into environment e
data(crude, verbose = TRUE, envir = e <- new.env())
# check what is in e
ls(e) # "crude"
# what is it?
class(e$crude)
summary(e$crude)
# we are satisfied that its what we want so remove e and load it into workspace
rm(e)
data(crude)
在上述情况中,crude
数据集只包含一个对象,它也叫做crude
,但并不总是这样。例如,state
数据集包含7个对象,没有一个叫做state
:
# load state into environment e
data(state, verbose = TRUE, envir = e <- new.env())
# check what is in e
ls(e) # there are 7 objects in e
?crude
、str(crude)
和summary(crude)
。 ?crude
甚至会为您提供一些文献参考。
?state
确实提供了关于所有7个数据集的信息。 - Eric Fail