秀丸エディタの複数ファイル文字一括削除No.36696
のの字 さん 18/07/06 14:53
 
//文字化けしていたので再投稿//


お世話になっております。

秀丸エディタの複数ファイル文字列一括削除が可能かどうかお伺いします。

1. 状況
 1)複数のcsv形式のファイルがあり、フォーマットはすべて同じ
 2)特定のカラムに[ユーロ記号]が入っており、これがExcelで開くと見えない
 3)秀丸他のテキストエディタでは半角空白2つに見える
 4)実際は[ユーロ記号]6.66  -[ユーロ記号]10.5 となっている

2. やりたいこと
 1)上記[ユーロ記号]を削除または置換し、6.66 -10.5 としたい
  2)ファイルが大量になる可能性があり、ワイルドカード指定やD&Dで実行したい
  3)その際、秀丸エディタは非表示にしたい

ご教示のほど、お願いいたします。

[ ]
RE:36696 秀丸エディタの複数ファイル文字No.36697
Iranoan さん 18/07/06 15:29
 
のの字さん今日は、Iranoan です
希望のことが出来るのか? 以前の話として、
>  2)特定のカラムに[ユーロ記号]が入っており、これがExcelで開くと見えない
に関してですが、現在保存されている CSV ファイルの文字コードは何でしょう?
Shift_JIS だとユーロ記号はコード割当の範囲外として扱われているのが原因かも知
れません
その場合、もし Shift_JIS なら「UNICODE(UTF-8)」で保存してやり、Excel 側でUTF
-8として開けば、そもそも置換する必要がないのかも知れません
ポイントは UTF-8 で保存する時に、「BOM を付ける」ことです
本来「UTF-8+BOM 付き」進められるものではないとされていますが、MS のアプリは
付けるのがデフォルトだったり、付いなていないと UTF-8 として扱ってくれなかっ
たりします
他には「BOM を付ける」代わりに、拡張子を txt にしてから Excel で開きます
こうすると、Excel で開く時に文字コードを指定できます
http://d.hatena.ne.jp/replication/20100211/1266232291

以下置換の方法について
> 秀丸エディタの複数ファイル文字列一括削除が可能かどうかお伺いします。
「検索」→「grepして置換」が希望の機能だと思います
公式ページでは
https://hide.maruo.co.jp/software/hidemaru7/new3.html
https://help.maruo.co.jp/hidemaru/html/190_CmdSearch_GrepReplace.html
また
https://help.maruo.co.jp/hidemaru/html/190_CmdSearch_Grep.html
も合わせてご覧ください

>  4)実際は[ユーロ記号]6.66  -[ユーロ記号]10.5 となっている
>
> 2. やりたいこと
>  1)上記[ユーロ記号]を削除または置換し、6.66 -10.5 としたい
>   2)ファイルが大量になる可能性があり、ワイルドカード指定やD&Dで実行したい
>   3)その際、秀丸エディタは非表示にしたい
上記の操作だと、「正規表現」と「最小化状態で実行」オプションを使えば良いかと

具体的には、便宜上「[ユーロ記号]」は以下「"ユーロ記号"」として記述すると
検索文字列:"ユーロ記号"([0-9\.]+) -"ユーロ記号"([0-9\.]+)
置換文字列:\1 \2
として、上記 2 つのオプションを ON にします
※動作希望の例の記述で、数字の後ろで半角全角ん空白が混在しており、本当にその
通りで良いのか分からないので、上記使用例では全て全角空白で記載しています

[ ]
RE:36697 秀丸エディタの複数ファイル文字No.36698
秀丸担当 さん 18/07/06 16:15
 

秀丸エディタでやるとしたら、Iranoanさんの言われる通り、「grepして置換」でや
ることになると思います。

ただExcelで表示されず、秀丸エディタで半角空白2になって見える文字というのが、
本当にユーロ記号なのかどうかというのが謎なので、grepして置換でうまくいくかど
うかわからないです。

秀丸エディタで文字コードを表示させる機能があります。メニューバーに表示させる
場合、[その他]→[メニュー編集]で、「表示(V)」のメニュー内のコマンドの下のほ
うに「文字コード表示(C)」があるので、これをONにします。
秀丸エディタで該当のファイルを開いて、ユーロ記号の場所にカーソル移動して[表
示]→[文字コード表示]をすると、各種文字コードが表示されます。
この文字コードがどうなっているかわかると、より正確なことがわかると思います。
Unicodeのユーロ記号だとしたら、U+20ACとなっていて、秀丸エディタでは半角空白
2つではなく、ユーロ記号そのままになって見えると思います。

[ ]
RE:36698 秀丸エディタの複数ファイル文字No.36699
のの字 さん 18/07/06 17:07
 
Iaonanさん、秀丸担当さん

 コメントありがとうございます。

 秀丸でUTF-8,16, BOM無し有りを試しても表示されずどうしたものかと思っていた
ら、このファイルは欧州から送られてきたというのに思い当たり「欧文」でエンコー
ドしたらビンゴでした。

 A[ユーロ記号]が入ってました。
 ↑
 このAは上に山があるもので、これです。
 https://ja.wikipedia.org/wiki/%C3%82

 今回ちょっと時間がなかったので、マウス操作で見えないままコピー、置換で削除
することができたので、そのキー操作を記録し再生して他のファイルでも同様の処理
ができました。
 いろいろ教えて頂いたのですが、活用することができず申し訳ありません。。。

取り急ぎ、ご報告まで。



[ ]
RE:36699 秀丸エディタの複数ファイル文字No.36700
のの字 さん 18/07/06 17:12
 
大事なことを忘れてました。

今回こちらで処理したのは時間の制限があったからで、本来は作成元で削除してもら
うものです。

「余計なものつけてくんな!」と言っておきますので、ユーロ記号に関してはクロー
ズとさせてください。

[ ]