文本挖掘中的getText函数是什么？它源自哪里？[r]

Question

文本挖掘中的getText函数是什么？它源自哪里？[r]

4

我正在跟随 Nathan Dannerman 和 Richard Heimann 的《Social Media Mining with R》中的文本挖掘示例：这本书。在使用 searchTwitter 函数拉取推文后，作者使用 sapply 对 list 进行操作以提取文本部分，如下所示：

rstats <- searchTwitter("#rstats", n = 1000)

rstats_list <- sapply(rstats, function (x) x$getText())

这样可以轻松地生成一个仅包含推文文本部分的字符向量。那么，getText() 是什么？我在任何地方都找不到相关信息 - 作者没有充分解释。我查看了 tm 包的文档 - 没有发现！我在 SO 上寻找了与此相关的问题 - 获取推文文本回答者也问了同样的问题。在 Inside-R 上，我找到了这个：http://www.inside-r.org/r-doc/base/gettext 但它与 getText 不同。有人能解释一下我错过了什么吗？

- vagabond

1

这可能是在rstats上定义的S4方法。 isS4（rstats）为真吗？ - Rich Scriven

这是错误的，但我认为你是正确的。我执行了 str(rstats)，其中列出了一个名为 getText 的方法。我尝试了 is.object(rstats)，但它也返回了 false。 - vagabond

你尝试过 lsf.str("package:rstats") 吗？它应该列出该包中的所有函数。 - lawyeR

如果您键入 rstats[[1]]$getText，那么它会显示函数代码吗？ - Tom Liptrot

3个回答

0

一旦您创建了名为“rstats”的列表，并在环境中检查它（在RStudio中），它会显示每个推文以及每个个体推文的所有相关信息，并在其下方显示一些访问方法。您可以在那里检查getText()，以获取每个推文的纯文本内容。

- Pruthvi Ustepalle

-2

getText() 函数用于提取推文的文本内容。

示例：

rstats <- searchTwitter("#rstats", n = 1000)

rstats[[1]]$$getText()

使用 twitteR 库处理推文数据。

一些用于处理推文的有用函数：

getScreenName(), getId(), getCreated()

- Haresh Makwana

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Nathan D · Accepted Answer

getText是“status”类的访问方法，如此处所述：http://www.inside-r.org/howto/mining-twitter-airline-consumer-sentiment。

抱歉没有在文本中澄清， Nathan Danneman