unicodeのファイルで変換エラーがでるNo.23685
ツルパパ さん 07/09/25 22:41
 
現在、秀丸ver7.0を使用してJIS-X-0213の文字コード表を作成しています。
ファイルの保存はunicode(UTF-8)で行っていますが、ファイルを開いたときに
「unicode(UTF-8)で読み込み中に変換できなかった文字がXXX箇所ありました」
と表示されます。(UTF-16で保存しても同じメッセージが出ます)

変換できなかった文字を拾い集めてみると、CJK Unified Ideographs Extension A(U
+3400 〜 U+4DBF)の文字であることがわかりました。
でもこのエリアすべての文字がエラーとなるのではなく、

Unihan.txt(3991): U+34C7 kJIS0213 2,03,15 ○
Unihan.txt(5023): U+351F kJIS0213 2,03,40 ×
  この間エラー
Unihan.txt(81581): U+4CD1kJIS0213 2,94,13 ×
Unihan.txt(82316): U+4D07kJIS0213 2,94,43 ○

なんとなく、u+3500以上u+4D00未満がエラーとなっているようです。
エラーは無視しても正しい字が表示され特に問題は無いのですが、
メッセージが気になります。
unicodeのファイルの文字について何か範囲チェック等行われているのでしょうか?

[ ]
RE:23685 unicodeのファイルで変換エラーNo.23691
秀丸担当 さん 07/09/26 10:36
 

>変換できなかった文字を拾い集めてみると、CJK Unified Ideographs Extension A(U
>+3400 〜 U+4DBF)の文字であることがわかりました。
>でもこのエリアすべての文字がエラーとなるのではなく、

確かに、この範囲は有効ではないものとして認識するように作ってありました。
いつの間にか追加されていたようで、エラーとならないように修正させていただ
きます。

とりあえず、[その他]→[動作環境]→[ファイル]→[エンコード2]→[開くときの
エンコードの種類関連]の、「変換できない文字があったとき警告メッセージを
表示」をOFFにしておけばエラーは出なくなります。

[ ]
RE:23691 unicodeのファイルで変換エラーNo.23700
ツルパパ さん 07/09/26 18:14
 
回答ありがとうございます。

>確かに、この範囲は有効ではないものとして認識するように作ってありました。
>いつの間にか追加されていたようで、エラーとならないように修正させていただ
>きます。

対応よろしくお願いします。

[ ]