我正在尝试清理我的句子,我想要删除其中的标签(以下划线加单词形式出现,例如"_UH")。
基本上,我想要删除下划线后面的字符串(同时也删除下划线本身)。
需要输出的内容:
以下是我尝试的代码:
当前输出:
['hanks_NNS sir_VBP',
'Oh_UH thanks_NNS to_TO remember_VB']
需要输出的内容:
['hanks sir',
'Oh thanks to remember']
以下是我尝试的代码:
for i in text:
k= i.split(" ")
print (k)
for z in k:
if "_" in z:
j=z.replace("_",'')
print (j)
当前输出:
ThanksNNS
sirVBP
OhUH
thanksNNS
toTO
rememberVB
RemindVB