認識出来ない文字を一括削除には?No.26764
KRT さん 09/06/27 11:12
 
お世話になります。以下の文字は、秀丸では黒塗りのKに近い文字で表示されるが、
置換等が出来ず、手作業で削除していますが、一括で出来る方法があれば、教えて下
さい。
秀丸からのコピペ: 。また、
(実際の表示は、。Kまた、でKの部分が黒塗りです)
無意味な文字なので、全て削除したいのですが、
この文字だけうまく認識出来ない様です。
宜しくお願いします。

[ ]
RE:26764 認識出来ない文字を一括削除にはNo.26765
KRT さん 09/06/27 11:20
 
この特殊文字は、アプリによって表示が変わります。下の投稿ではその通りに表示さ
れず、秀丸にコピペしても再現しません。
メモ帳では、小さな矢印 
htmlでは、疑問符 。?また、
wordでは、改行
excelでは、黒の中丸
と、色々に変わります。

>お世話になります。以下の文字は、秀丸では黒塗りのKに近い文字で表示されるが、
>置換等が出来ず、手作業で削除していますが、一括で出来る方法があれば、教えて
>下さい。
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>宜しくお願いします。

[ ]
RE:26764 認識出来ない文字を一括削除にはNo.26766
三月 さん 09/06/27 14:22
 
>お世話になります。以下の文字は、秀丸では黒塗りのKに近い文字で表示されるが、
>置換等が出来ず、手作業で削除していますが、一括で出来る方法があれば、教えて
>下さい。
>秀丸からのコピペ: 。また、
>(実際の表示は、。Kまた、でKの部分が黒塗りです)

秀丸エディタで黒塗りのK は垂直タブと言う制御コードですね。
「その他」-「制御コードの入力」で11番の HM Ctrl+Kを入れてみると
確認できると思います。

置換するにはヘルプで「制御コード」を探すと
目次− 検索系コマンド− 正規表現−エスケープシーケンス
のところにある「\v 垂直タブコード(文字コード11) 」のように
「\v」を置換するか「\x0b」(16進で11は0b)で指定すればよいです。



[ ]
RE:26766 認識出来ない文字を一括削除にはNo.26767
KRT さん 09/06/27 15:40
 
>>お世話になります。以下の文字は、秀丸では黒塗りのKに近い文字で表示されるが、
>置換等が出来ず、手作業で削除していますが、一括で出来る方法があれば、教えて
>下さい。
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>
大変有り難うございます。お陰様で出来ました。
C, Z, ] の3文字も黒塗りで見つかりました。
\x03, \x1dで、Cと]は処理出来ましたが、Zは\x1a/\x1Aでも出来ず。
Zは、SUBstitute(置換)制御コード1Aかと思うのですが、、
有り難うございました。

[ ]
RE:26767 認識出来ない文字を一括削除にはNo.26768
三月 さん 09/06/27 16:08
 
>大変有り難うございます。お陰様で出来ました。
>C, Z, ] の3文字も黒塗りで見つかりました。
>\x03, \x1dで、Cと]は処理出来ましたが、Zは\x1a/\x1Aでも出来ず。
>Zは、SUBstitute(置換)制御コード1Aかと思うのですが、、
>有り難うございました。

ヘルプをよくよく見ると
>\oooと \xhh以外のエスケープシーケンスで表現できないコントロールコード(文字
>コード32未満のキャラクタ)は検索できません。 \oooや \xhhで指定しても検索はう
>まくいきません。

ってありましたね。たまたまできたのかな。
Zも秀丸でその文字をコピーして、置換ダイアログにペーストしたら
警告は出て文字が化けるものの置換できるような・・

[ ]
RE:26768 認識出来ない文字を一括削除にはNo.26769
KRT さん 09/06/27 18:46
 
>>大変有り難うございます。お陰様で出来ました。
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>警告は出て文字が化けるものの置換できるような・・
確かにそうですね。
置換は出来ましたが。
Zについては、手作業で消してしまい、検索出来ないので、元データが見つかりませ
ん。次に遭遇すれば、やってみます。

[ ]
RE:26769 認識出来ない文字を一括削除にはNo.26770
秀丸担当 さん 09/06/29 10:49
 

>コード32未満のキャラクタ)は検索できません。 \oooや \xhhで指定しても検索はう
>まくいきません。

ヘルプにはこのように書いてありましたが、一部を除いた制御コードは検索でき、
できないものが幾つかありました。
\x00(NULL文字) \x1a(EOF)はうまくできないと思います。
\x0a \x0d の改行文字は内部的に変換されていて元のバイナリデータのままには
できず、\nを使う必要があります。

>Zについては、手作業で消してしまい、検索出来ないので、元データが見つかりませ
>ん。次に遭遇すれば、やってみます。

\x1a(Zの反転)は、本来はSUBstitute(置換)ということのようですが、テキス
トファイルにおいては旧来よりファイルの終わり(EOF)を表すようになっています。
(秀丸エディタの場合は、標準の設定では無視して読み込むようになっていま
す)
V7.11においては、\x1aを内部的に特殊な扱いをしている関係で、\x1aはうまく検
索できませんでした。
正規表現ONで、[\x1a] と書けば回避することもできるようです。
将来バージョンでは\x1aについてはうまく検索できるようになる予定です。

[ ]