全角カナ文字のエンコードについて質問No.26645
MKMK さん 09/06/01 14:51
 
初めて投稿します。

SJISとEUCの全角カナ文字が混在したテストデータを下記の手順で秀丸で作成しよう
としたところで作成しようとしたところうまくいきません。

1.EUCで アイウエオ をファイルに保存。

2.1のファイルをSJISで開き文字化けした ・「・、・ヲ・ィ・ェ の後ろに
  アイウエオ を追加。 ・「・、・ヲ・ィ・ェ アイウエオをSJISで保存。

3.再度EUCでファイルを開くと アイウエオアイウエオ と
  なっている。

EUCでファイルを開くときにSJISの全角カナ文字を自動的にEUCに置き換えているよう
なのですが、EUC⇒SJISの自動変換を解除する方法が分かりません。

よろしくお願いします。

[ ]
RE:26645 全角カナ文字のエンコードについNo.26646
秀丸担当 さん 09/06/01 17:08
 

手順通りにしてみたところ、言われている通りになりました。
Shift-JISのア〜オは、文字コードにすると 0x8341〜0x8349 のようです。
第一バイトが 0x83 というのはEUCでは存在しないので、認識エラーとなりまし
た。標準の設定のままだと、認識エラーのメッセージ出ていると思います。

秀丸エディタは、「日本語(EUC)」と「日本語(JIS)」の場合は、どちらもShift-
JISにいったん変換して、Shift-JISを基本として編集するようになっています。
そのため、EUCに存在しない文字コードはShift-JISに変換できずに、そのままの
コードで通してしまう結果、そのようになってしまうようです。
これはいまのところ仕様ということにさせていただこうと思います。申し訳あり
ません。

現状でバイナリレベルでデータを保持したまま編集するためには、バイナリモー
ドで編集するしかないと思います。ただ、バイナリモードで文字の編集をするの
は少し辛いかもしれません。

[ ]
RE:26646 全角カナ文字のエンコードについNo.26652
MKMK さん 09/06/02 10:06
 
了解しました。

>秀丸エディタは、「日本語(EUC)」と「日本語(JIS)」の場合は、どちらもShift-JIS
>にいったん変換して、Shift-JISを基本として編集するようになっています
>これはいまのところ仕様ということにさせていただこうと思います。申し訳ありま
>せん。

昔の秀丸では問題なく出来ていたので、動作環境に「Shift-JISにいったん変換する
機能をOFFにする」項目を追加していただくことを要望いたします。


[ ]
RE:26652 全角カナ文字のエンコードについNo.26654
秀丸担当 さん 09/06/02 10:35
 

>昔の秀丸では問題なく出来ていたので、動作環境に「Shift-JISにいったん変換する
>機能をOFFにする」項目を追加していただくことを要望いたします。

もし対応するとしたら、文字化けしたデータをバイナリレベルで保持したまま編
集することができるような機能になってくると思います。
特殊な機能となってくるので、できるかどうかは分かりませんが、ご意見として
参考にさせていただきます。

秀丸エディタは、昔からEUCはShift-JISにいったん変換して編集するようになっ
ています。
古いバージョンを確認してみたところ、V4.10未満では文字化けの仕方が違って
いました。
Shift-JISのアイウエオを読み込むと文字化けして「r`rbrdrfrh」という文字に
なっていました。そのまま保存すると文字化けしたまま保存されてしまうようで
す。

[ ]