Unicodeの文字化けNo.16815
fumio さん 04/03/03 03:28
 
いつもお世話になっております。

さっそくですが、

Windows 2000 + 秀丸v4.06をつかってUnicodeで日本語とアクセント記号つきのアル
ファベットを交ぜた文章を書いているのですけれども、どうしたわけか

iの頭にアクサン・シルコンフレックス(^のことです)のついたやつと、
iの頭にトレマ(小さい黒点がふたつ並んだもの)のついたやつ
oとeのくっついたやつ

の3つが何度か保存を繰り返しているうちに文字化けしてしまいます。

上記の3つ以外のアクセント記号つきアルファベット(3つ目のやつは正確にはアクセ
ント記号つき文字ではないですが)は文字化けしません。もっとも、全種類の文字を
テストとしたわけではないので、上記3つ以外にも文字化けするものがあるかもしれ
ません。

これはどうしたことでしょうか? こうしたことがらの事情にたいへん疎いもので、
わたしの個人的な不手際かもしれませんが、だれかご教示ください。

まったく関係ないかもしれませんがご参考までに、別の環境(WindowsXP + 秀丸v4.0
6 or v4.10b20)でも作業をしており、電子メール添付とかMDを経由して同じファイ
ルをやりとりしています。

よろしくお願いします。


[ ]
RE:16815 Unicodeの文字化けNo.16820
秀まるお2 さん 04/03/03 15:56
 
 文字化けする具体的な再現手順が分かれば助かるんですが、具体的な再現手順
が分からないとなると、うちとしても手探り的にあらゆるテストをしないといけ
なくて、かなり大変です。

 例えば、「保存してから秀丸を終了させて、また開いた時に化けていた」とか、
「クリップボードを経由するような編集をしていたら化けた」とか、何かもうち
ょっとヒントが欲しいです。

---------
 秀丸エディタ側の設定によって化ける、というか、例えば欧文文字が普通の英
文アルファベットに化けるということでしたら、「ファイルタイプ別の設定」の
中の「フォント」の「Unicode編集の許可」という欄の、3つのチェックボック
スが1つでもOFFになってる可能性があろうかと思います。ファイルタイプ別の
設定は、ファイルの拡張子によって複数使い分けることが出来るので、例えば特
定のファイル拡張子用の設定に限ってそこのオプションがOFFになってることが
あるのかもしれません。

 そういう使い勝手の悪い点があるのは承知してまして、実は次のV4.10βの方
では、上記3オプションは廃止(=すべてON扱い)となっています。

[ ]
RE:16820 Unicodeの文字化けNo.16821
fumio さん 04/03/03 19:02
 
情報が不十分で申し訳ありませんでした。

ずぶの素人なので、なにをどう報告してよいのかよく分からないのですが、私が見た
ままのことをできるだけ書いておきます。とんちんかんだったら申し訳ありません。

> 「保存してから秀丸を終了させて、また開いた時に化けていた」
> 「クリップボードを経由するような編集をしていたら化けた」

何回繰り返せば、いうことは分かりませんが、保存後に秀丸を終了させて、また開い
くという操作を何度か繰り返しているうちに、気づくと化けています。クリップボー
ドを経由する編集をすると化けるというわけではありません(いまのところ)。化け
てない文字列を、たとえばMSワードに貼りつけても、ワードから秀丸に貼りつけて
も、どちらも何度繰り返しても、いままでのところ化けてません。これは、今回ご報
告しました3つの文字どれも同じです。

文字化けした場合、他の普通のアルファベットとか「?」とかに化けるのではなく、

i+アクサン・シルコンフレックスは「半角の小さな黒丸」(大きさは「.」と同じだ
けど、位置としては「・」と同じく真ん中にある)になります。
i+トレマは「白抜きの半角のZ」「・」「白抜きの半角のE」がその順番で並んだや
つに化けます。(「白抜き」というのは、半角幅の縦長長方形の黒地に白で半角の文
字が表示されるという意味です。念のため。)
oとeのくっついたやつは、「白抜きの半角のZ」「半角カタカナのモ」「・」になり
ます。

いま試行錯誤していて判明したのですが、grepの結果の画面でも文字化けします。i
+アクサン・シルコンフレックスは「半角幅の黒い縦長長方形」になります。それ以
外のふたつは上に書いたとおりに化けます。


それから、ご教示いただいた「ファイルタイプ別の設定」の「unicode編集の許可」
は3つともチェックが入っていました。

足りないようなら、あるいはピントが外れているようなご指摘ください。

[ ]
RE:16821 Unicodeの文字化けNo.16822
秀まるお2 さん 04/03/03 19:28
 
 詳しい情報ありがとうございます。化け方の様子によると、これは明らかに秀
丸のバグで起きる現象です。

 化けるタイミングとしては、たぶん保存の時なんだろうと思います。1つ思い
当たる可能性はあるので、ソースコードを追っかけるなどして原因を考えてみま
す。

 少々お待ちください。

[ ]
RE:16821 Unicodeの文字化けNo.16823
秀まるお2 さん 04/03/03 19:52
 
 こちらでいろいろ再現テスト&ソースコードの見直しなどした所、再現方法が
分かりました。

 ファイルタイプ別の設定での「保存・読み込み」ページの「保存する時の変
換」が、「空白をタブに変換する」になっていると、特定条件のUnicode文字が
化けてしまうようです。

 これはこれで大変なバグを出してしまってすみません。

 とりあえず、上記オプションを「変換なし」にすれば回避できると思います。
それでしばらく回避して欲しいです。

 バグの方はちゃんと直して早めに正式版としてアップロードさせていただきま
す。少々お待ちください。

[ ]
RE:16823 Unicodeの文字化けNo.16824
fumio さん 04/03/03 22:32
 
お世話になっております。

>  ファイルタイプ別の設定での「保存・読み込み」ページの「保存する時の変
> 換」が、「空白をタブに変換する」になっていると、特定条件のUnicode文字が
> 化けてしまうようです。
> とりあえず、上記オプションを「変換なし」にすれば回避できると思います。
> それでしばらく回避して欲しいです。

いま確認したところ、当該設定は「変換なし」になっております。なにか別の要因か
もしれません。

恐縮です。よろしくお願いします。




[ ]
RE:16824 Unicodeの文字化けNo.16825
秀丸担当 さん 04/03/04 14:52
 

>いま確認したところ、当該設定は「変換なし」になっております。なにか別の要因か
>もしれません。
>
>恐縮です。よろしくお願いします。

さらに調査したところ、[その他]→[動作環境]→[編集]→[高速化]→[テンポラ
リファイルを利用して再オープンの高速化]が有効なときで、再オープンで開い
た後にUnicode独自の文字を一度も入力せずに保存すると文字化けすることが判
明しました。このオプションを無効にすると、回避することができると思います。
至急修正してバージョンアップしたいと思います。申しわけありません。

[ ]
RE:16825 Unicodeの文字化けNo.16828
fumio さん 04/03/04 18:03
 
お世話になっております。

> さらに調査したところ、[その他]→[動作環境]→[編集]→[高速化]→[テンポラ
> リファイルを利用して再オープンの高速化]が有効なときで、再オープンで開い
> た後にUnicode独自の文字を一度も入力せずに保存すると文字化けすることが判
> 明しました。このオプションを無効にすると、回避することができると思います。

迅速な対応をありがとうございました。助かります。

今後ともよろしくお願いします。

[ ]