你好,我正在尝试使用Python 2.7在下载的推文中查找所有表情符号。
我已经尝试使用以下代码:
import os
import codecs
import emoji
from nltk.tokenize import word_tokenize
def extract_emojis(token):
emoji_list = []
if token in emoji.UNICODE_EMOJI:
emoji_list.append(token)
return emoji_list
for tweet in os.listdir(tweets_path):
with codecs.open(tweets_path+tweet, 'r', encoding='utf-8') as input_file:
line = input_file.readline()
while line:
line = word_tokenize(line)
for token in line:
print extract_emojis(token)
line = input_file.readline()
然而,我只得到了空列表,而不是表情符号。如果我得到下面的推文:
schuld van de sossen SP.a: wij hebben niks gedaan Groen: we gaan energie VERBIEDEN!
代码的输出结果是:
[]
期望输出的结果没有出现:
[, ]
需要帮忙吗?谢谢!