我希望删除下面字符串中的一部分(加粗显示),该字符串存储在oldString中。
当我输出newString时,没有任何内容被删除。
[DMSM-8433] 加護亜依 Kago Ai – 加護亜依 vs. FRIDAY
我正在使用Python中的以下正则表达式。p=re.compile(ur"( [\W]+) (?=[A-Za-z ]+–)", re.UNICODE)
newString=p.sub("", oldString)
当我输出newString时,没有任何内容被删除。
oldString
应该转换为 Unicode。它已经转换成了吗?你如何获得它?在声明p
之前尝试使用oldString = unicode(oldString, "utf-8")
。 - Wiktor Stribiżew# -*- coding: utf-8 -*-
,根据我所读的内容,这应该将其转换为Unicode。我从一个HTML页面中获取它。 @Kasramvd 预期输出应该是 "[DMSM-8433] Kago Ai – 加護亜依 vs. FRIDAY"。 - Paul Thomas