|
秀丸ではunicodeのテキストファイルを普通に読みこんだ場合、文字化けしてしまい
ますがその原因らしきものがわかったので報告します。
まず失礼だとは思いましたが、unicode文章の取り扱いが正常にできるxyzzyと言うエ
ディタと比較させていただきました。
まず秀丸で"天丼"と言う文章を書きutf-8で保存しました。
それをバイナリエディタで開くと
E5 A4 A9 E4 B8 BC
になります。
次にxyzzyで"天丼"と言う文章を書きutf-8で保存しました。
それをバイナリエディタで開くと
EF BB BF E5 A4 A9 E4 B8 BC
になります。
つまりxyzzyではEF BB BFと言う3バイトのデータが始めに入ります。
これはどの文章でも同じでunicodeで保存すれば必ずこの3バイトが入ります。
xyzzyで保存したテキストファイルのほうで秀丸,xyzzy両方で読みこみましたら両方
で自動的にutf-8になり、文字化けしませんでした。
秀丸で保存したほうは両方共文字化けしました。
おそらく秀丸ではこの3バイトのデータがutf-8で保存しても書きこまれないため、
文字化けすると思います。
大変失礼な比較方法ですがあえて書かせていただきました。
次のバージョンアップの参考にと願っております。
|
|