Unicode のマーカーが消えてしまいます
No.01959
Naoki Hada
さん 03/06/25 05:15
3.19 からの問題なのですが、UTF-8 (マーカー付き)を開くと、
UTF-8として認識してくれるのですが、セーブするとマーカーが
なくなって UTF-8N となってしまいます。
マーカーを保存するようにと、Save as のメニューでUTF-8, UTF-8N
など明確に分けていただけますと、助かります。
XPのノートパッドでは、UTF-8 と保存するとマーカーをつけてくれます。
cf.
http://www-106.ibm.com/developerworks/library/utfencodingforms/
-Naoki
[
△
]
RE:01959 Unicode のマーカーが消えてしま
No.01960
アルビレオ
さん 03/06/25 07:48
アルビレオです。
>3.19 からの問題なのですが、UTF-8 (マーカー付き)を開くと、
>UTF-8として認識してくれるのですが、セーブするとマーカーが
>なくなって UTF-8N となってしまいます。
IBMではそうやって区別しているんですね。
以前その話は出ていました。
http://www.maruo.co.jp/hidesoft/2/x14287_.html#14295
現状ではBOMは強制削除となっています。
http://www.linux.or.jp/JM/html/LDP_man-pages/man7/utf-8.7.html#lbAE
ここでは
>0xfffe, 0xffff という UCS コードの値は、UTF-8 に準拠したストリームに
>入れるべきではない。
とされています。
[
△
]