我有一个包含文本、控制字符、数字、德语umlauts和其他utf8字符的字符串。
我想要去除所有不是“语言部分”的utf8字符。特殊字符如(非完整列表)“:/ \ ßä、; \ n \ t”都应该被保留。
不幸的是,stackoverflow删除了所有这些字符,所以我必须附上一张图片(link)。
有任何想法吗?非常感谢帮助!
PS:如果有人知道一个不会杀死这些特殊字符的粘贴服务,我将非常高兴上传字符串..我只是找不到一个..
[编辑]:我认为正则表达式“\ P {Cc}”是我想保留的所有字符。这个正则表达式是否可以被反转,以便返回所有不匹配这个正则表达式的字符?
我想要去除所有不是“语言部分”的utf8字符。特殊字符如(非完整列表)“:/ \ ßä、; \ n \ t”都应该被保留。
不幸的是,stackoverflow删除了所有这些字符,所以我必须附上一张图片(link)。
有任何想法吗?非常感谢帮助!
PS:如果有人知道一个不会杀死这些特殊字符的粘贴服务,我将非常高兴上传字符串..我只是找不到一个..
[编辑]:我认为正则表达式“\ P {Cc}”是我想保留的所有字符。这个正则表达式是否可以被反转,以便返回所有不匹配这个正则表达式的字符?