我在 Python 中有一个字符串,格式如下:
u'\u200cHealth & Fitness'
我该如何去掉 ?\u200c
从字符串中截取部分内容?
我在 Python 中有一个字符串,格式如下:
u'\u200cHealth & Fitness'
我该如何去掉 ?\u200c
从字符串中截取部分内容?
你可以将其编码为 ascii
并忽略错误:
u'\u200cHealth & Fitness'.encode('ascii', 'ignore')
输出:
'Health & Fitness'
如果你有一个包含 Unicode
字符的字符串,比如:
s = "Airports Council International \u2013 North America"
那么您可以尝试:
newString = (s.encode('ascii', 'ignore')).decode("utf-8")
输出结果将是:
北美机场协会国际
如果有帮助,点赞一下 :)
list_text_fixed = [(s.encode('ascii', 'ignore')).decode("utf-8") for s in list_text]
- timothyjgraham我只是使用replace,因为我不需要它:
varstring.replace('\u200c', '')
或者在您的情况下:
u'\u200cHealth & Fitness'.replace('\u200c', '')
strip()
会忽略它。在大多数 Unicode 字符串情况下,您不应使用 encode(ascii, ignore)
。 - Chet对我而言,以下方法可行:
mystring.encode('ascii', 'ignore').decode('unicode_escape')
u'\200c'
字符为前缀,解决方案就是简单地取一个不包括第一个字符的切片。original = u'\u200cHealth & Fitness'
fixed = original[1:]
original = u'\u200cHealth & Fitness'
fixed = original.lstrip(u'\u200c')
original = u'\u200cHealth & Fitness'
fixed = original.removeprefix(u'\u200c')
s.encode('utf-8')
- Chen A.\xe2\x80\x8c健康与健身
。 - V.Anhascii
,就像Arount在下面回答的那样。 - Chen A.