読者です 読者をやめる 読者になる 読者になる

本当は怖い情報科学

情報系大学院生の趣味&実益ブログ。

Perl Perl

機種依存文字入りのShiftJISを扱う。 - D-5 出張版

ShiftJISのファイルを読み込んでUnicodeにdecodeする時にEncodeを使ってはいけない。だが、Encodeが悪い訳ではない。悪いのは機種依存文字である。もうとにかくバケバケになるのである。


よくわからないのですが、オチを見るに、ここで言われている機種依存文字というのはNEC選定のIBM拡張文字のことでしょうか?


それなら、PerlIOのエンコーディングとして shiftjis を指定する代わりに、cp932 を指定することで解決します。

【広告】