grep時の文字コード判別についてNo.17835
nashida さん 04/08/24 20:27
 
nashidaと申します。

-----------ここから(aaa.txt)
name: john
city: ニューオリンズ
map: 0152

name: sam
city: デンバー
map: 0128

name: mike
city: サクラメントシティー
map: 0180

name: smith
city: デンバー
map: 0160
-----------ここまで
※カタカナは半角カナ

上のような半角カナを含むSJISのテキストファイルを
"city"でgrepすると、grepした行のみで文字コード判定を
行っているみたいで、下のような文字化けした結果が出力されます。
(秀丸は、EUCと判別しているみたいです)

-----------
aaaa.txt(2): city: 騰圧憬殉
aaaa.txt(6): city: 筑殃洌
aaaa.txt(10): city: 燦徠歡蔀┛
aaaa.txt(14): city: 筑殃洌
-----------

ここで、ご質問なのですが、
grepした行のみで文字コード判定を行わないで、
grep元ファイルの文字コードをgrep結果に
反映させる設定はありますでしょうか?
(grep元ファイルは、SJISと正しく文字コードを判別されています。)


環境:
WindowsXP SP1,秀丸4.12,HMJREDLL V1.10

[ ]
RE:17835 grep時の文字コード判別についてNo.17843
秀丸担当 さん 04/08/25 17:47
 

>上のような半角カナを含むSJISのテキストファイルを
>"city"でgrepすると、grepした行のみで文字コード判定を
>行っているみたいで、下のような文字化けした結果が出力されます。
>(秀丸は、EUCと判別しているみたいです)

確認することができました。
これは、grepした行のみで文字コード判定をしているわけではなく、判定の仕方
そのものがgrep時と通常の読み込み時で異なる点があるためでした。
次に先行開発バージョンが出るときに修正させていただきます。

[ ]