我想确定我的向量中包含哪些表情符号:
x = c('', 'no', '', '', 'no', '', '䨺', '감사')
x
# [1] "\U0001f602" "no" "\U0001f379" "\U0001f600" "no" "\U0001f61b" "䨺" "감사"
相关帖子只涵盖其他语言,而且因为它们大多是指专业库,我无法想出一种将其翻译成R的方法:
- 提取字符串中所有表情符号的正则表达式是什么?
- 如何从字符串中删除表情符号
- 使用javascript中的regexp替换表情符号unicode符号
- 在Mac OS X / iOS中匹配表情符号的正则表达式
- 使用python中的re移除unicode表情符号
第二个看起来非常有前途,但不幸的是(即使提供perl = TRUE
也无法解决):
x[grepl('[\u{1F600}-\u{1F6FF}]', x)]
错误:无效的 \u{xxxx} 序列(第1行)
其他问题也会出现类似的情况。我们如何在R中匹配表情符号?