本当は怖いHPC

HPC屋の趣味&実益ブログ

Encode::Guessでファイルのエンコーディングを自動判別するのは便利なんですが、

open my $fh, "<:encoding(Guess)", "foo.txt";
while( <$fh> ) {
  ...
}
close $fh;

のようにしたとき、これって行ごとの判定になるのでしょうか?

短い行で、euc-jpUTF-8が判別されなくて困りました。仕方が無いので、ファイルをslurpしてから行ごとに分割することに。
まぁファイル自体はサイズが小さいので問題は無かったんですが。うーん、きっとうまい方法があるのだろうなぁ。

【広告】