unicodeのファイルで変換エラーがでる - 秀丸エディタ関連ソフト会議室 - スレッド23685, 2007/09/25

unicodeのファイルで変換エラーがでる

ツルパパ さん　07/09/25 22:41

現在、秀丸ver7.0を使用してJIS-X-0213の文字コード表を作成しています。
ファイルの保存はunicode(UTF-8)で行っていますが、ファイルを開いたときに
「unicode(UTF-8)で読み込み中に変換できなかった文字がXXX箇所ありました」
と表示されます。(UTF-16で保存しても同じメッセージが出ます)

変換できなかった文字を拾い集めてみると、CJK Unified Ideographs Extension A(U
+3400 ～ U+4DBF)の文字であることがわかりました。
でもこのエリアすべての文字がエラーとなるのではなく、

Unihan.txt(3991): U+34C7 kJIS0213 2,03,15 ○
Unihan.txt(5023): U+351F kJIS0213 2,03,40 ×
　　この間エラー
Unihan.txt(81581): U+4CD1kJIS0213 2,94,13 ×
Unihan.txt(82316): U+4D07kJIS0213 2,94,43 ○

なんとなく、u+3500以上u+4D00未満がエラーとなっているようです。
エラーは無視しても正しい字が表示され特に問題は無いのですが、
メッセージが気になります。
unicodeのファイルの文字について何か範囲チェック等行われているのでしょうか？

RE:23685 unicodeのファイルで変換エラー

秀丸担当 さん　07/09/26 10:36

>変換できなかった文字を拾い集めてみると、CJK Unified Ideographs Extension A(U
>+3400 ～ U+4DBF)の文字であることがわかりました。
>でもこのエリアすべての文字がエラーとなるのではなく、

確かに、この範囲は有効ではないものとして認識するように作ってありました。
いつの間にか追加されていたようで、エラーとならないように修正させていただ
きます。

とりあえず、[その他]→[動作環境]→[ファイル]→[エンコード2]→[開くときの
エンコードの種類関連]の、「変換できない文字があったとき警告メッセージを
表示」をOFFにしておけばエラーは出なくなります。

RE:23691 unicodeのファイルで変換エラー

ツルパパ さん　07/09/26 18:14

回答ありがとうございます。

>確かに、この範囲は有効ではないものとして認識するように作ってありました。
>いつの間にか追加されていたようで、エラーとならないように修正させていただ
>きます。

対応よろしくお願いします。