我将从一个包含半UTF-8编码的文件中读取行,并希望将其转换为Perl内部表示以进行进一步操作。
file.in (纯ASCII):
MO\\xc5\\xbdN\\xc3\\x81
NOV\\xc3\\x81
这些应该翻译成MOŽNÁ和NOVÁ。
我加载这些行并将它们升级为正确的UTF8符号,即\\xc5\\xbd -> \x{00c5}\x{00bd}
。然后,我想将这个升级的$line
让Perl在内部表示:
for my $line (@lines) {
$line =~ s/x(..)/x{00$1}/g;
eval { $l = "$line"; };
}
很抱歉,没有成功。