我目前只了解CRF的理论,并希望在我的硕士论文中使用Python crfsuite从食谱中提取成分。非常感谢任何帮助。
据我所知,我可以像下面的图片一样向crfsuite提供训练数据,其中w [0]提供当前单词的标识符,w [i]是相对于i的单词,pos [i]是相对于i的词性标签。
据我所知,我可以像下面的图片一样向crfsuite提供训练数据,其中w [0]提供当前单词的标识符,w [i]是相对于i的单词,pos [i]是相对于i的词性标签。
然后 crfsuite 基于给定的属性训练自己的特征函数。
但我找不到提供自定义特征函数的方法,例如“w[i]在字典中”(例如食谱成分字典)或“句子中是否有否定词”(例如“not”或“don't”)。
总的来说,我很需要好的教程,因为从我的角度来看,手册(https://python-crfsuite.readthedocs.io/en/latest/ 或 http://www.chokkan.org/software/crfsuite/manual.html)不适合初学者。