有没有一些知名或成功的算法,可以从问题句子中的单词获取主题和/或焦点?
如果没有的话,我该如何获取问题的主题/焦点?似乎问题的主题/焦点通常是名词或名词短语。
那么,我首先要做的是通过对问题进行词性标注来确定名词。但是,我应该只获取名词,还是获取名词和前面的形容词,或者名词和前面的副词,或者名词和动词?
例如:
在“did the quick brown fox jump over the lazy dog”中,获取“quick brown fox”、“jump”和“lazy dog”。
在“what is the population of japan”中,获取“population”和“japan”。
在“what color is milk”中,获取“color”和“milk”。
在“What is the height of Mt. Everest”中,获取“Mt. Everst”和“Height”。
写这些时,我发现最简单的方法是去除停用词。
如果没有的话,我该如何获取问题的主题/焦点?似乎问题的主题/焦点通常是名词或名词短语。
那么,我首先要做的是通过对问题进行词性标注来确定名词。但是,我应该只获取名词,还是获取名词和前面的形容词,或者名词和前面的副词,或者名词和动词?
例如:
在“did the quick brown fox jump over the lazy dog”中,获取“quick brown fox”、“jump”和“lazy dog”。
在“what is the population of japan”中,获取“population”和“japan”。
在“what color is milk”中,获取“color”和“milk”。
在“What is the height of Mt. Everest”中,获取“Mt. Everst”和“Height”。
写这些时,我发现最简单的方法是去除停用词。