Unicode のマーカーが消えてしまいますNo.01959
Naoki Hada さん 03/06/25 05:15
 
3.19 からの問題なのですが、UTF-8 (マーカー付き)を開くと、
UTF-8として認識してくれるのですが、セーブするとマーカーが
なくなって UTF-8N となってしまいます。
マーカーを保存するようにと、Save as のメニューでUTF-8, UTF-8N
など明確に分けていただけますと、助かります。
XPのノートパッドでは、UTF-8 と保存するとマーカーをつけてくれます。

cf.
http://www-106.ibm.com/developerworks/library/utfencodingforms/

-Naoki

[ ]
RE:01959 Unicode のマーカーが消えてしまNo.01960
アルビレオ さん 03/06/25 07:48
 
アルビレオです。

>3.19 からの問題なのですが、UTF-8 (マーカー付き)を開くと、
>UTF-8として認識してくれるのですが、セーブするとマーカーが
>なくなって UTF-8N となってしまいます。

IBMではそうやって区別しているんですね。

以前その話は出ていました。
http://www.maruo.co.jp/hidesoft/2/x14287_.html#14295
現状ではBOMは強制削除となっています。

http://www.linux.or.jp/JM/html/LDP_man-pages/man7/utf-8.7.html#lbAE
ここでは
>0xfffe, 0xffff という UCS コードの値は、UTF-8 に準拠したストリームに
>入れるべきではない。
とされています。

[ ]