grep時の文字コード判別について - 秀丸エディタ関連ソフト会議室 - スレッド17835, 2004/08/24

grep時の文字コード判別について

nashida さん　04/08/24 20:27

nashidaと申します。

-----------ここから(aaa.txt)
name: john
city: ﾆｭｰｵﾘﾝｽﾞ
map: 0152

name: sam
city: ﾃﾞﾝﾊﾞｰ
map: 0128

name: mike
city: ｻｸﾗﾒﾝﾄｼﾃｨｰ
map: 0180

name: smith
city: ﾃﾞﾝﾊﾞｰ
map: 0160
-----------ここまで
※カタカナは半角カナ

上のような半角カナを含むSJISのテキストファイルを
"city"でgrepすると、grepした行のみで文字コード判定を
行っているみたいで、下のような文字化けした結果が出力されます。
（秀丸は、EUCと判別しているみたいです）

-----------
aaaa.txt(2): city: 騰圧憬殉
aaaa.txt(6): city: 筑殃洌
aaaa.txt(10): city: 燦徠歡蔀┛
aaaa.txt(14): city: 筑殃洌
-----------

ここで、ご質問なのですが、
grepした行のみで文字コード判定を行わないで、
grep元ファイルの文字コードをgrep結果に
反映させる設定はありますでしょうか？
（grep元ファイルは、SJISと正しく文字コードを判別されています。）

環境：
WindowsXP SP1,秀丸4.12,HMJREDLL V1.10

RE:17835 grep時の文字コード判別について

秀丸担当 さん　04/08/25 17:47

>上のような半角カナを含むSJISのテキストファイルを
>"city"でgrepすると、grepした行のみで文字コード判定を
>行っているみたいで、下のような文字化けした結果が出力されます。
>（秀丸は、EUCと判別しているみたいです）

確認することができました。
これは、grepした行のみで文字コード判定をしているわけではなく、判定の仕方
そのものがgrep時と通常の読み込み時で異なる点があるためでした。
次に先行開発バージョンが出るときに修正させていただきます。