在http://www.gnu.org/software/libiconv/上,有20种中文编码格式:Chinese EUC-CN、HZ、GBK、CP936、GB18030、EUC-TW、BIG5、CP950、BIG5-HKSCS、BIG5-HKSCS:2004、BIG5-HKSCS:2001、BIG5-HKSCS:1999、ISO-2022-CN和ISO-2022-CN-EXT。
我有一个文本文件,它不是UTF-8,而是ASCII编码。我想使用
我注意到以下内容:
我有一个文本文件,它不是UTF-8,而是ASCII编码。我想使用
iconv()
将其转换为UTF-8,但需要知道源文件的字符编码方式。如果我不懂中文,该怎么办呢?:(我注意到以下内容:
$str = iconv('GB18030', 'UTF-8', $str);
file_put_contents('file.txt', $str);
生成的文件是UTF-8编码,而我尝试的其他编码(CP950、GBK和EUC-CN)则生成了ASCII文件。这是否意味着iconv
能够检测到输入编码与给定字符串不匹配?