我有一个UTF-8文件,想要将一些2字节的字符替换为一些HTML标签。
我想用Python脚本实现。只需逐个字符读取文件,并进行一些if操作等等即可。
我的问题是,如果逐个字符读取,那么我只会读取一个字节,但有些字符却是1个字节,有些则是2个字节长。
如何解决这个问题?
我基本上需要的功能是能够逐个字符读取,但它会知道这个字符是1个字节还是2个字节的大小。
我想用Python脚本实现。只需逐个字符读取文件,并进行一些if操作等等即可。
我的问题是,如果逐个字符读取,那么我只会读取一个字节,但有些字符却是1个字节,有些则是2个字节长。
如何解决这个问题?
我基本上需要的功能是能够逐个字符读取,但它会知道这个字符是1个字节还是2个字节的大小。