我有一个单词列表,例如:
words = ['one','two','three four','five','six seven']
我想创建一个新的列表,其中列表中的每个项只是一个单词,如下所示:
words = ['one','two','three','four','five','six','seven']
最好的做法是将整个列表连接成一个字符串,然后对字符串进行分词吗?像这样:
word_string = ' '.join(words) tokenize_list = nltk.tokenize(word_string)
还是有更好的选择?
words = ['one','two','three four','five','six seven']
我想创建一个新的列表,其中列表中的每个项只是一个单词,如下所示:
words = ['one','two','three','four','five','six','seven']
最好的做法是将整个列表连接成一个字符串,然后对字符串进行分词吗?像这样:
word_string = ' '.join(words) tokenize_list = nltk.tokenize(word_string)
还是有更好的选择?
' '.join(words).split(' ')
这段代码有什么问题吗? - EdChum