首先,我将树转换为列表:
您插入一个已经标记化的句子,它会返回一棵树。
def LanguageCreateTree(tokenizedSentence):
cp = nltk.RegexpParser(GRAMMAR)
result = cp.parse(tokenizedSentence)
result = str(result)
print(result)
>>> A red cat with a hat
(S A/DT (VP red/VBN (NP cat/NN)) with/IN a/DT hat/JJ)
我该如何基于这个字符串创建一个包含列表的列表?我需要它能够生成以下列表:
[['A','DT'], ['VP', ['red','VBN'], ['NP', ['cat','NN']]], ['with','IN'], ['a','DT'], ['hat','JJ']]]
'S'
标识符吗? - KobeJohn