本当は怖いHPC

HPC屋の趣味&実益ブログ

機種依存文字入りのShiftJISを扱う。 - D-5 出張版

ShiftJISのファイルを読み込んでUnicodeにdecodeする時にEncodeを使ってはいけない。だが、Encodeが悪い訳ではない。悪いのは機種依存文字である。もうとにかくバケバケになるのである。


よくわからないのですが、オチを見るに、ここで言われている機種依存文字というのはNEC選定のIBM拡張文字のことでしょうか?


それなら、PerlIOのエンコーディングとして shiftjis を指定する代わりに、cp932 を指定することで解決します。

【広告】