我正在尝试使用NLTK工具包从文本消息中提取地点、日期和时间信息。我刚刚在我的电脑上安装了该工具包,并编写了以下代码来进行测试:
sentence = "Let's meet tomorrow at 9 pm";
tokens = nltk.word_tokenize(sentence)
pos_tags = nltk.pos_tag(tokens)
print nltk.ne_chunk(pos_tags, binary=True)
我原本认为它会识别出日期(明天)和时间(晚上9点)。但是,令人惊讶的是它没能识别出来。当我运行上面的代码时,我得到了以下结果:
(S (GPE Let/NNP) 's/POS meet/NN tomorrow/NN at/IN 9/CD pm/NN)
有人能帮我理解一下,是我遗漏了什么还是NLTK在标记时间和日期方面还不够成熟呢。谢谢!