unocodeファイルgrep時の文字化けについてNo.15757
masakirin さん 03/11/12 16:33
 
もしかしたら、同様の投稿があったかも知れないのですが、検索しても見つからなか
ったため、こちらに投稿させて頂きます。

秀丸のver4.00を利用しているのですが、unicode(UTF8)で保存したハングル表記を含
む文書にgrepをかけると、結果が文字化けします。
全てが文字化けするのではなく、ハングル部分だけが全て「?」になります。

参考になるかもしれないので、文字化けの状態の文書を貼っておきます。

?? NN 4 1766 320 C
???? NN 2 2045 320 C

実際は(この文字がでないかもしれないですが)「황제」「총&#49
324;령관」という文字が入っています。

この間まで秀丸のver3.17を使っていて、そのときには、問題なく出力されていたの
ですが、今回、何か、仕様が変わったりしたのでしょうか?

[ ]
RE:15757 unocodeファイルgrep時の文字化No.15758
masakirin さん 03/11/12 16:34
 
すいません、やっぱり、ハングルは文字参照になっちゃいました。

>実際は(この文字がでないかもしれないですが)「황제」「총&#4
>9324;령관」という文字が入っています。
>

[ ]
RE:15757 unocodeファイルgrep時の文字化No.15759
秀丸担当 さん 03/11/12 18:36
 

>秀丸のver4.00を利用しているのですが、unicode(UTF8)で保存したハングル表記を含
>む文書にgrepをかけると、結果が文字化けします。
>全てが文字化けするのではなく、ハングル部分だけが全て「?」になります。

これは、V4.00β4のときにUnicode独自の文字を含む文字のgrepで文字化けする
というバグが報告されたため、回避するために「?」とするようになっていまし
た。
さらに調べたところ、このバグも修正できることがわかったので、V4.02で修正
させていただきます。

[ ]
RE:15759 unocodeファイルgrep時の文字化No.15760
masakirin さん 03/11/12 21:28
 
迅速なご回答ありがとうございます。
v4.02のリリースを楽しみにしています。

>
>>秀丸のver4.00を利用しているのですが、unicode(UTF8)で保存したハングル表記を含
>>む文書にgrepをかけると、結果が文字化けします。
>>全てが文字化けするのではなく、ハングル部分だけが全て「?」になります。
>
>これは、V4.00β4のときにUnicode独自の文字を含む文字のgrepで文字化けする
>というバグが報告されたため、回避するために「?」とするようになっていまし
>た。
>さらに調べたところ、このバグも修正できることがわかったので、V4.02で修正
>させていただきます。

[ ]