文字コードがうまく判別できなくなりましNo.31033
muramatu1201 さん 12/03/21 12:03
 
win7 home で秀丸エディタver8.12を使っています。
今まで普通に何の問題も無く保存していたファイルを開いたところ、わけの分からな
い文字が出るようになりました。そのファイルは全角で英数字と漢字を使ってありま
すが、別に変った漢字を使っているわけではありません。
動作環境→ファイル→エンコード1→複数のエンコード種類に適合する場合→候補の
一覧を表示でEUCを選択するとようやく文字が正常に表示されるようになりました。
ところが今度別のテキストを保存したら、「文字コード変換できない文字が含まれて
います。」と表示されました。文字コード変換できない文字にジャンプさせると数字
の半角文字でした。
今まで秀丸エディタを使ってきてデコード、エンコードでこんなことがおこったこと
は無かったのですがどうしたのでしょう。

[ ]
RE:31033 文字コードがうまく判別できなくNo.31035
秀まるお2 さん 12/03/21 16:33
 
 そちらの状況がいまいちよく分からないのですけども、要するに、EUC文字
コードのファイルがあって、それを開く時に、いちいちエンコード種類を選択す
るウィンドウが出てくるようになってしまったってことでしょか。

 以前は、特にそういう問い合わせが出ることなく、EUCでちゃんと開いてくれ
たはずということでしたら、やはり「動作環境・ファイル・エンコード1」の所
の設定の違いによる動作の違いってことじゃないかと思います。

 秀丸エディタのバージョンによって、この辺の判定ロジック(EUCかShift-JIS
かの判定ロジック)が違うことは無いはずだし、Windows7になって動作が変わる
ことも無いはずだと思います。

 とりあえず、「動作環境・ファイル・エンコード1」の「ファイルの内容を解
析してエンコードの種類を自動認識する」の所での日本語Shift-JISと日本語EUC
の順序を、日本語EUCの方を優先順位的に上に移動して、さらに「最初に確定し
たものにする」をONにすれば、以前の通りに、EUCのファイルはEUCで開くはずだ
と思います。

 ただ、その設定だと、もしも半角カナとローマ字だけで全角文字がほとんど入
ってないようなShift-JISのファイルがあると、それを間違ってEUCとして開いて
しまう可能性があります。なので、もしそれが心配でしたら、ご面倒でも現状の
設定のまま(問い合わせダイアログが出てくるまま)で使っていただいた方が安
心だと思います。

 あるいは、もしも以前は同じ設定でもたしかに自動でEUCと判定していたはず
ってことでしたら、もしかしてものすごく昔の秀丸エディタのバージョンだった
とすると、むしろそっちのバージョンの方の判定ロジックがいいかげんだったた
めに、たまたま自動でEUCとして開いてしまってた可能性が高いように思います。

 あるいは、もしもその、Shift-JISかEUCかの自動判定がおかしいと思わしき
ファイルを僕の所に送っていただいてもいい内容でしたら、何かzipファイルな
どに圧縮した上で添付ファイルで送っていただくといいかもしれないです。それ
で僕の方でテストが出来ます。

 もし可能でしたらお願いします。

 送り先は、"maruo@mitene.or.jp"になります。

[ ]
RE:31035 文字コードがうまく判別できなくNo.31036
muramatu1201 さん 12/03/21 16:52
 
> そちらの状況がいまいちよく分からないのですけども、要するに、EUC文字
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
> 送り先は、"maruo@mitene.or.jp"になります。

補足します。
win7になってからもごく最近まで自然と読み書きできていました。秀丸のバージョン
が変ってからも自然にできていました。
また私は特に変ったテキストは使っていません。
メールでテキストを送らせていただきますのでよろしくお願いします。

[ ]
RE:31036 文字コードがうまく判別できなくNo.31038
秀まるお2 さん 12/03/21 22:16
 
 メールでもお返事した所ですが、一応ここにもコメントしてしまいます。

■ファイルその1(小さいサイズの方)

 こちらはEUC文字コードのファイルなんですが、Shift-JISと解釈しても一応化
けてはいない(半角カナと第2水準の漢字がいくつかある)ってなってしまうの
で、一応秀丸エディタ的には問い合わせダイアログが出てしまうと思います。

 ただ、「半角カナと第2水準の漢字しか無い」ってのは常識的に考えたらあり
えないことなので、それを見て判定することは可能かと思います。実際、秀丸
メールの方での文字コード自動判定では、第1水準漢字と第2水準漢字の割合を
見て判定する処理もやってます。

 秀丸エディタの方でもそういう判定ロジックを将来的には入れたい所ではあり
ます。ただ、この辺の処理を下手にいじるとちょっと怖いので、今すぐはちょっ
と難しいです。(テストとかも大変だし)

■ファイルその2(大きいサイズの方)

 こちらはいわゆるユニコード(UTF-16とも言う)のファイルになりまして、
「動作環境・ファイル・エンコード1」の「UnicodeのBOMを認識」がONになって
いればうまく自動判定して開くはずだと思います。

[ ]