如何在Perl中读取ISO 8859-1（Latin-1）编码的文本

Question

如何在Perl中读取ISO 8859-1（Latin-1）编码的文本

8

我正在尝试编写一个perl脚本来读取一个使用Latin-1编码的文件，但是出现了问题。当我尝试搜索一个我知道在文件中存在的字符（它在第一行中），什么也没搜索到。我尝试使用use encoding "iso 8859-1";来指定编码方式，但我也尝试过binmode(STDIN, ":utf8");。有什么建议吗？我可能做错了什么，应该怎么做才对？

use encoding "iso 8859-1";

while(<>)
{
    if(/ó/gi)
    {
    print "Found one!\n";
    }
}

- John Montgomery

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- tchrist · Accepted Answer

不要使用“use encoding”编译指示：它已经失效了。在这里指定编码方式：

use open ":encoding(Latin1)";

或将其放在开放的位置：

open(FH, "< :encoding(Latin1)", $pathname)
   || die "can't open $pathname: $!";

或者在打开后使用binmode：

binmode(FH, ":encoding(Latin1)")
   || die "can't binmode to encoding Latin1";

如果您正在使用<ARGV>，那么use open可能是最简单的方法。同时也不要忘记在输出流上设置编码。