我知道这是一个广泛的话题,但我正在寻找一个简洁易懂的教程,介绍从文本中提取含义的方法,最好使用Python。举个例子,如果用户发布了以下博客帖子:
"曼尼·拉米雷斯今天将回归道奇队对阵休斯顿太阳"
有什么轻量/简单的方法可以从句子中获取名词?首先,我认为我会限制它只提取专有名词,但我不想仅限于此(也不想依赖假设任何标题大写的文本都是专有名词的简单正则表达式)。
更糟糕的是,有哪些问题我没有问到但应该问?我需要一些现有单词的语料库来开始吗?我需要了解哪些词汇分析技术才能使其发挥作用?我确实看到了另一个问题涉及到这方面的内容,我正在查阅那些资源。