UnicodeのgrepについてNo.05783
ivan さん 04/07/10 08:31
 
こんにちは。
中国語の簡体字をUtf-8で使用していますが、簡体字を検索語としてgrepをかけると
ヒットしてくれません。「ファイルタイプ別の設定」でgrepのフォントをArial Unic
ode MSにしても結局Shift-Jisで処理が行われるようです。秀丸の仕様のような気も
しますが、対策がありましたらお聞かせください。

[ ]
RE:05783 UnicodeのgrepについてNo.05784
Iranoan さん 04/07/10 18:37
 
 ivan さん今日は、Iranoan です。
> 中国語の簡体字をUtf-8で使用していますが、簡体字を検索語としてgrepをかける
> とヒットしてくれません。
 文字コードの自動認識はどうなっているでしょう? 自動認識を ON にすると、
grep ができます。
http://hidemaruo.dip.jp:81/turukame/turukame_3/x01487.html#1510

[ ]
RE:05784 UnicodeのgrepについてNo.05785
Iranoan さん 04/07/10 18:49
 
 ivan さん今日は、Iranoan です。
 自己フォローです。
> 自動認識を ON にすると、
> grep ができます。
と思ったのですが、日本語以外の JIS にない文字は駄目みたいですねm(__)m。

[ ]
RE:05785 UnicodeのgrepについてNo.05788
秀まるお さん 04/07/12 14:26
 
> と思ったのですが、日本語以外の JIS にない文字は駄目みたいですねm(__)m。

 grepのコマンドラインが日本語しか受け付けないために、日本語以外の検索は
うまくいかないようです。

 これはこれでまずい話です。なんとか対策を考えます。たぶん、grep時のコマ
ンドラインにutf-8の文字列が書けるようにしないとダメな気がします。

 V4.10βには間に合わないかもしれません。

 しばらくお待ちください。

[ ]
RE:05788 UnicodeのgrepについてNo.05790
ivan さん 04/07/12 14:48
 

> これはこれでまずい話です。なんとか対策を考えます。たぶん、grep時のコマ
>ンドラインにutf-8の文字列が書けるようにしないとダメな気がします。
>
> V4.10βには間に合わないかもしれません。
>
> しばらくお待ちください。

了解しました。よろしくお願いします。

[ ]
RE:05790 UnicodeのgrepについてNo.05796
ivan さん 04/07/13 19:42
 
追加になりますが、UTF-8のファイルを編集時に中国語の簡体字をBOX貼り付けすると
文字が化ける点も検討してください。
よろしくお願いします。

[ ]
RE:05796 UnicodeのgrepについてNo.05809
秀丸担当 さん 04/07/16 17:10
 

回答が遅くなり申しわけありません。
調べてみたところ、中国語のgrepは、コマンドラインだけでなく、内部的な処理
も全てUnicode化しなくてはいけなくなってくるため、現在のところ保留とさせ
てください。

>追加になりますが、UTF-8のファイルを編集時に中国語の簡体字をBOX貼り付けすると
>文字が化ける点も検討してください。
>よろしくお願いします。

こちらの件は、再現させることができませんでした。
「ニイハオ」の中国語独自の漢字をBOX選択、コピー、貼り付けしても問題あり
ませんでした。
どのようにしたら再現するでしょうか。

[ ]
RE:05809 UnicodeのgrepについてNo.05810
ivan さん 04/07/16 18:28
 
こんにちは。

>こちらの件は、再現させることができませんでした。
>「ニイハオ」の中国語独自の漢字をBOX選択、コピー、貼り付けしても問題あり
>ませんでした。
>どのようにしたら再現するでしょうか。

試してみましたら、「BOX貼り付け」した場合のみ化けました。
コピーの方法は関係ないようです。

[ ]
RE:05810 UnicodeのgrepについてNo.05821
秀丸担当 さん 04/07/20 15:09
 

>試してみましたら、「BOX貼り付け」した場合のみ化けました。
>コピーの方法は関係ないようです。

BOX貼り付けのほうでした。すみません。
確認できました。
修正させていただきます。

[ ]
RE:05821 UnicodeのgrepについてNo.05861
ivan さん 04/07/23 21:38
 
こんにちは。

>BOX貼り付けのほうでした。
>確認できました。
>修正させていただきます。

修正ありがとうございました。助かります。
Ver4.10β36の改版履歴で「BOX貼り付けのUnicode対応」とあって
びっくりしました。
とりあえずお礼まで。

[ ]