据我所知,Python的概念是字符串中只包含有效字符,但在我的情况下,操作系统将提供带有无效编码的路径名字符串,我必须处理这些字符串。因此,我最终得到了包含非unicode字符的字符串。
为了解决这些问题,我需要以某种方式显示这些字符串。不幸的是,我无法打印它们,因为它们包含非unicode字符。是否有一种优雅的方法来替换这些字符,以至少获得字符串内容的一些想法?
我的想法是逐个处理这些字符串中的字符,并检查存储的字符是否实际为有效的unicode。对于无效字符,我想使用某个unicode符号。但是,我该如何做呢?使用codecs似乎不适合此目的:我已经有一个由操作系统返回的字符串,而不是字节数组。将字符串转换为字节数组似乎涉及到解码,这显然会失败。所以看起来我陷入了困境。
你有什么建议可以帮助我创建这样一个替换字符串吗?
为了解决这些问题,我需要以某种方式显示这些字符串。不幸的是,我无法打印它们,因为它们包含非unicode字符。是否有一种优雅的方法来替换这些字符,以至少获得字符串内容的一些想法?
我的想法是逐个处理这些字符串中的字符,并检查存储的字符是否实际为有效的unicode。对于无效字符,我想使用某个unicode符号。但是,我该如何做呢?使用codecs似乎不适合此目的:我已经有一个由操作系统返回的字符串,而不是字节数组。将字符串转换为字节数组似乎涉及到解码,这显然会失败。所以看起来我陷入了困境。
你有什么建议可以帮助我创建这样一个替换字符串吗?