文字コードの自動認識 バグ?No.02924
freeak さん 03/09/01 20:10
 
freeakです。

文字コードを以下で保存したものを、ダブルクリックで開くと違った文字コードと認
識してしまい、文字化けします。

UTF-7   ->  SHIFT_JIS
UTF-8   ->  EUC

3.19 では

UTF-7   ->  SHIFT_JIS
UTF-8   ->  UTF-8

となっていました。

テキストとしては、単純に、「あいう」と改行 ぐらいです。
また、環境設定では、すべての文字コードにチェックを入れています。

[ ]
RE:02924 文字コードの自動認識 バグ?No.02928
でるもんた さん 03/09/02 17:38
 
でるもんたです。

> 文字コードを以下で保存したものを、ダブルクリックで開くと違った文字
> コードと認識してしまい、文字化けします。
>
> UTF-7   ->  SHIFT_JIS
> UTF-8   ->  EUC
>
> 3.19 では
>
> UTF-7   ->  SHIFT_JIS
> UTF-8   ->  UTF-8
>
> となっていました。

UTF-7 はその性質上、ASCII の文章(従って日本語エディタの秀丸では Shift_JIS)
と見なされてもやむをえないんじゃないでしょうか。

UTF-8 については秀丸内部の挙動が変わったんでしょうか。

> テキストとしては、単純に、「あいう」と改行 ぐらいです。

こういう短すぎるテストデータはあんまりよくないです。
ある程度まで長いデータを与えてやらないと自動判別はうまくいきません。

[ ]
RE:02928 文字コードの自動認識 バグ?No.02930
秀丸担当 さん 03/09/02 19:04
 

V4.00では自動認識の方法がが微妙に変わっています。
でるもんたさんの言われる通り、情報が少ないと特定がしにくいですが、「あい
う」のケースでEUCとなってしまうのは認識が甘いので、修正させていただきま
す。

[ ]
RE:02930 文字コードの自動認識 バグ?No.02957
freeak さん 03/09/08 00:15
 
●でるもんたさん

> UTF-7 はその性質上、ASCII の文章(従って日本語エディタの秀丸では Shift_JIS)
> と見なされてもやむをえないんじゃないでしょうか。

そういわれると、自動認識の設定で UTF-7 ってないですね。
UTF-7 は実際使うことはないと思うので、私も今のままで問題ないとおもいます。

●秀丸担当さん

>V4.00では自動認識の方法がが微妙に変わっています。
>でるもんたさんの言われる通り、情報が少ないと特定がしにくいですが、
>「あいう」のケースでEUCとなってしまうのは認識が甘いので、修正させていただき
>ます。

よろしくおねがいします。
長い文章でも誤認識していました。

[ ]