我正在使用Yake(另一种关键字提取器)从数据框中提取关键字。我想仅提取二元组和三元组,但是Yake只允许设置最大ngram大小而不是最小大小。您将如何移除它们?
例如df.head(0):
文本: “oui,yes,i mumbled,the linguistic transition now in limbo。”
关键字: [('oui', 0.04491197687864554), ('linguistic transition', 0.09700399286574239), ('mumbled', 0.15831692877998726)]
我想从关键字列中删除oui、mumbled以及他们的分数。
谢谢您抽出时间!
例如df.head(0):
文本: “oui,yes,i mumbled,the linguistic transition now in limbo。”
关键字: [('oui', 0.04491197687864554), ('linguistic transition', 0.09700399286574239), ('mumbled', 0.15831692877998726)]
我想从关键字列中删除oui、mumbled以及他们的分数。
谢谢您抽出时间!