|
こんにちは hee と申します。
UTF-8 コードの xml ファイルを急に扱わなくてはならなくなりました。
それで以下のような問題が発生しました。
●グレップ結果が文字化けする(グレップでは文字コードの自動判別がおこなわれな
い??)、グレップ結果を Shift-Jis で保存し、改めて文字コードを指定して開く
と化けは解消するのですが、ただしく検索されていない
●また、UTF-8 の XML ファイルを文字コードを指定して開き、
正規表現で
置換前:[0-9]\f<td>
置換後:\0◎\1
のように指定して、たとえば「abc1<td>」などを「abc1◎<td>」
検索置換を行うと、うまく行く箇所と失敗する箇所があります。さらに、失敗した箇
所では、「abc1◎<td>」とはならずに、「abc◎<td>」のように数字が勝手に削除さ
れてしまい、困っています。正規表現に限らず、もっと簡単な置換でも検索漏れが発
生してしまいます。
このファイル、秀丸で文字コードを指定して開くと、一行が非常に長く、
それが原因かどうかは分からないのですが、検索速度自体もものすごく遅くなります。
たった1000行程度の置換に1分はかかっています。
このあたりのことを解決する術はあるのでしょうか?
#マクロとは直接関係がないので、ここに投稿すべきではなかったら
すみません。
|
|