|
現在、秀丸ver7.0を使用してJIS-X-0213の文字コード表を作成しています。
ファイルの保存はunicode(UTF-8)で行っていますが、ファイルを開いたときに
「unicode(UTF-8)で読み込み中に変換できなかった文字がXXX箇所ありました」
と表示されます。(UTF-16で保存しても同じメッセージが出ます)
変換できなかった文字を拾い集めてみると、CJK Unified Ideographs Extension A(U
+3400 〜 U+4DBF)の文字であることがわかりました。
でもこのエリアすべての文字がエラーとなるのではなく、
Unihan.txt(3991): U+34C7 kJIS0213 2,03,15 ○
Unihan.txt(5023): U+351F kJIS0213 2,03,40 ×
この間エラー
Unihan.txt(81581): U+4CD1kJIS0213 2,94,13 ×
Unihan.txt(82316): U+4D07kJIS0213 2,94,43 ○
なんとなく、u+3500以上u+4D00未満がエラーとなっているようです。
エラーは無視しても正しい字が表示され特に問題は無いのですが、
メッセージが気になります。
unicodeのファイルの文字について何か範囲チェック等行われているのでしょうか?
|
|