文本挖掘中的getText函数是什么?它源自哪里?[r]

4

我正在跟随 Nathan Dannerman 和 Richard Heimann 的《Social Media Mining with R》中的文本挖掘示例:这本书。在使用 searchTwitter 函数拉取推文后,作者使用 sapplylist 进行操作以提取文本部分,如下所示:

rstats <- searchTwitter("#rstats", n = 1000)

rstats_list <- sapply(rstats, function (x) x$getText())

这样可以轻松地生成一个仅包含推文文本部分的字符向量。那么,getText() 是什么?我在任何地方都找不到相关信息 - 作者没有充分解释。我查看了 tm 包的文档 - 没有发现!我在 SO 上寻找了与此相关的问题 - 获取推文文本 回答者也问了同样的问题。在 Inside-R 上,我找到了这个:http://www.inside-r.org/r-doc/base/gettext 但它与 getText 不同。有人能解释一下我错过了什么吗?


1
这可能是在rstats上定义的S4方法。 isS4(rstats)为真吗? - Rich Scriven
这是错误的,但我认为你是正确的。我执行了 str(rstats),其中列出了一个名为 getText 的方法。我尝试了 is.object(rstats),但它也返回了 false。 - vagabond
你尝试过 lsf.str("package:rstats") 吗?它应该列出该包中的所有函数。 - lawyeR
如果您键入 rstats[[1]]$getText,那么它会显示函数代码吗? - Tom Liptrot
3个回答

6

0

一旦您创建了名为“rstats”的列表,并在环境中检查它(在RStudio中),它会显示每个推文以及每个个体推文的所有相关信息,并在其下方显示一些访问方法。您可以在那里检查getText(),以获取每个推文的纯文本内容。


-2

getText() 函数用于提取推文的文本内容。

示例:

rstats <- searchTwitter("#rstats", n = 1000)

rstats[[1]]$$getText()

使用 twitteR 库处理推文数据。

一些用于处理推文的有用函数:

getScreenName(), getId(), getCreated()

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接