異常増殖No.26293
eigodoo1 さん 09/03/04 12:18
 
あるファイルを翻訳ソフトへ登録しようとすると、次のようなことが発生します:


1)エラー「不正な文字{0x5)」が含まれています。入力できません」と。

2)このファイル自体は1から2MB程度なのに、エラー後、30GB程度にこのソフトのフ
ォルダーが異常増殖している。


なぜか?

このファイルを秀丸あてに送信します。調査を求む。

[ ]
RE:26293 異常増殖No.26294
eigodoo1 さん 09/03/04 13:14
 
>あるファイルを翻訳ソフトへ登録しようとすると、次のようなことが発生します:
>
>
>1)エラー「不正な文字{0x5)」が含まれています。入力できません」と。
>
>2)このファイル自体は1から2MB程度なのに、エラー後、30GB程度にこのソフトのフ
>ォルダーが異常増殖している。
>
>
>なぜか?
>
>このファイルを秀丸あてに送信します。調査を求む。


先ほどの送信したフィルは10MBでしたね。今度は、約2MBのファイルを送ります。こ
の2MBのファイルも同様の結果になります。なぜですか?

[ ]
RE:26294 異常増殖No.26295
秀まるお2 さん 09/03/04 14:56
 
 最初に送っていただいたファイルについては、僕が見た限りでは、「0x5」の
制御コードは入ってないようでした。普通のShift-JISのテキストファイルだと
思います。

 後で送っていただいた方については、0x1F、0x01、0xF等の制御コードが多数
入っているようでした。

 制御コードを検索するには、検索コマンドで、以下のようにすればいいです。

 検索: [\x01-\x08\x0b\x0c\x0e-\x1f]
 正規表現:  ON

 そうすると、タブ文字および改行文字以外の制御コードを検索して、そこに
カーソル移動します。

 ちなみに秀丸エディタでは、制御コードはA〜Zおよび

    [ \ ] ^ _

 の文字を白黒反転したような形で表示しています。例えば\x01の制御文字は
「A」という文字を白黒反転したような表示になり、\x1Fは「_」を白黒反転した
ような表示になります。

 制御文字が入っているのがなぜだか僕には分かりませんが、とりあえず、制御
文字が入っていることで翻訳ソフトがうまく解釈しないということであれば、制
御文字を手作業で除去する等するしか無いんじゃないかと思います。

[ ]
RE:26295 異常増殖No.26296
秀まるお2 さん 09/03/04 15:02
 
 すみません。最初の方にコメントするの忘れてました。

> 1)エラー「不正な文字{0x5)」が含まれています。入力できません」と。

 先に送っていただいた方のファイルにはたしかに0x05の制御文字は入ってない
はずなので、なぜそのエラーが出るのかは、僕にも分かりません。

> 2)このファイル自体は1から2MB程度なのに、エラー後、30GB程度にこのソフトのフ
> ォルダーが異常増殖している。

 その翻訳ソフトというのは僕の作ったソフトじゃないので、すみませんが、そ
のソフトの動作についてはなんとも分かりません。

[ ]
RE:26295 異常増殖No.26297
eigodoo1 さん 09/03/04 15:59
 
> 最初に送っていただいたファイルについては、僕が見た限りでは、「0x5」の
>制御コードは入ってないようでした。普通のShift-JISのテキストファイルだと
>思います。
>
> 後で送っていただいた方については、0x1F、0x01、0xF等の制御コードが多数
>入っているようでした。
>
> 制御コードを検索するには、検索コマンドで、以下のようにすればいいです。
>
> 検索: [\x01-\x08\x0b\x0c\x0e-\x1f]
> 正規表現:  ON
>
> そうすると、タブ文字および改行文字以外の制御コードを検索して、そこに
>カーソル移動します。
>
> ちなみに秀丸エディタでは、制御コードはA〜Zおよび
>
>    [ \ ] ^ _
>
> の文字を白黒反転したような形で表示しています。例えば\x01の制御文字は
>「A」という文字を白黒反転したような表示になり、\x1Fは「_」を白黒反転した
>ような表示になります。
>
> 制御文字が入っているのがなぜだか僕には分かりませんが、とりあえず、制御
>文字が入っていることで翻訳ソフトがうまく解釈しないということであれば、制
>御文字を手作業で除去する等するしか無いんじゃないかと思います。


[ \ ] ^ _
で、制御文字を置換できません。なぜですか?ヒットしません。

[ ]
RE:26297 異常増殖No.26298
eigodoo1 さん 09/03/04 17:32
 
>> 最初に送っていただいたファイルについては、僕が見た限りでは、「0x5」の
>>制御コードは入ってないようでした。普通のShift-JISのテキストファイルだと
>>思います。
>>
>> 後で送っていただいた方については、0x1F、0x01、0xF等の制御コードが多数
>>入っているようでした。
>>
>> 制御コードを検索するには、検索コマンドで、以下のようにすればいいです。
>>
>> 検索: [\x01-\x08\x0b\x0c\x0e-\x1f]
>> 正規表現:  ON
>>
>> そうすると、タブ文字および改行文字以外の制御コードを検索して、そこに
>>カーソル移動します。
>>
>> ちなみに秀丸エディタでは、制御コードはA〜Zおよび
>>
>>    [ \ ] ^ _
>>
>> の文字を白黒反転したような形で表示しています。例えば\x01の制御文字は
>>「A」という文字を白黒反転したような表示になり、\x1Fは「_」を白黒反転した
>>ような表示になります。
>>
>> 制御文字が入っているのがなぜだか僕には分かりませんが、とりあえず、制御
>>文字が入っていることで翻訳ソフトがうまく解釈しないということであれば、制
>>御文字を手作業で除去する等するしか無いんじゃないかと思います。
>
>
>[ \ ] ^ _
>で、制御文字を置換できません。なぜですか?ヒットしません。


「制御文字」とは何ですか?

[ ]
RE:26297 異常増殖No.26299
秀まるお2 さん 09/03/04 17:37
 
 制御文字の、例えば\x1Fの制御文字があったとすると、画面上では、たしかに

   「_」  (アンダースコアという文字)

 を白黒反転したような表示になると思いますが、これは別に、そこに「_」と
いう文字があるという意味ではなくて、あくまで「\x1F」、つまり、文字コード
が16進数で1Fの制御文字があることを無理矢理表現しているだけです。

 制御文字というのは、基本的に、画面上での見える記号として表現することが
難しい物なので、こういう無理矢理な表現をしています。(秀丸エディタでは)

 ちなみにメモ帳で開いてみると、制御文字の所は単に「・」のような感じで出
てくるだけで、何があるのかよく分からないと思います。秀丸エディタでは、と
りあえず制御文字があることが「反転」という見せ方によって分かる程度に表現
しているつもりです。

 ということで、しつこく書かせていただきますけど、制御文字の所というのは、
画面上に「_」のような文字があるように見えるとしても、そこに「_」という文
字そのものが存在する訳ではありません。なので、例えば置換コマンドを使って
「_」を何か他の文字に置き換えるような操作をしたとしても、\x1Fの制御文字
が置換されることはありません。

 もしも、置換コマンドを使って\x1Fの制御文字を置換するとしたら、

 検索:  \x1F
 正規表現 = ON

 として置換する必要があります。例えば\x1Fの制御文字を削除したい場合なら、

 検索:  \x1F
 正規表現 = ON

 とした上で、置換文字列を空っぽにして置換コマンドを実行すればいいと思い
ます。

 とにかく制御文字を全部削除したいということであれば、

 検索:  [\x01-\x08\x0b\x0c\x0e-\x1f]
 正規表現 = ON

 にして、置換文字列を空っぽにして実行すればいいと思います。

[ ]
RE:26298 異常増殖No.26300
秀まるお2 さん 09/03/04 17:46
 
> 「制御文字」とは何ですか?

 制御文字というのは、文字コードで言う所の、0〜31、(16進数で表現する
と0x00〜0x1F)の文字のことですが…。制御文字は何かというのをうまく説明す
るのは大変難しいです。

 制御文字というのは、昔々の大型コンピュータとそこに接続するターミナルと
いう装置の間でデータをやりとりする時の、例えば「カーソルを上に移動せよ」
のようなコマンドを指示する用の文字だった、ということが始まりかと思います
けども…。

 とりあえずこういう専門用語について分からないことがあったら、まずは
googleで検索してみることをお勧めします。(というか、既にそうやっておられ
るのだとしたら余計なお世話ですみませんが)

 インターネット閲覧ソフトで、

 http://www.google.co.jp

 を開いて、そこの

 [___________________________] [Google検索]

 となっている所に、例えば「制御文字」って入力してgoogle検索ボタンを押せ
ばいいです。そうすると、制御文字とは何かについて説明したページが多数ヒッ
トします。

 「制御文字とは」で検索してもいいです。

 例えばエクスプローラの使い方が分からない時は、「エクスプローラ 使い
方」で検索すると、そのものずばりの「エクスプローラの使い方」みたいなペー
ジが出てきます。

 例えば僕がここの文章で「16進数」という言葉を使ってますが、それの意味
が分からない場合はgoogleで「16進数とは」を検索してみればいいです。そう
いう具合で普通はみんな検索して勉強していると思います。

[ ]
RE:26300 異常増殖No.26301
eigodoo1 さん 09/03/05 08:57
 
>> 「制御文字」とは何ですか?
>
> 制御文字というのは、文字コードで言う所の、0〜31、(16進数で表現する
>と0x00〜0x1F)の文字のことですが…。制御文字は何かというのをうまく説明す
>るのは大変難しいです。
>
> 制御文字というのは、昔々の大型コンピュータとそこに接続するターミナルと
>いう装置の間でデータをやりとりする時の、例えば「カーソルを上に移動せよ」
>のようなコマンドを指示する用の文字だった、ということが始まりかと思います
>けども…。
>
> とりあえずこういう専門用語について分からないことがあったら、まずは
>googleで検索してみることをお勧めします。(というか、既にそうやっておられ
>るのだとしたら余計なお世話ですみませんが)
>
> インターネット閲覧ソフトで、
>
> http://www.google.co.jp
>
> を開いて、そこの
>
> [___________________________] [Google検索]
>
> となっている所に、例えば「制御文字」って入力してgoogle検索ボタンを押せ
>ばいいです。そうすると、制御文字とは何かについて説明したページが多数ヒッ
>トします。
>
> 「制御文字とは」で検索してもいいです。
>
> 例えばエクスプローラの使い方が分からない時は、「エクスプローラ 使い
>方」で検索すると、そのものずばりの「エクスプローラの使い方」みたいなペー
>ジが出てきます。
>
> 例えば僕がここの文章で「16進数」という言葉を使ってますが、それの意味
>が分からない場合はgoogleで「16進数とは」を検索してみればいいです。そう
>いう具合で普通はみんな検索して勉強していると思います。



丁重な説明に感謝を申し上げる。

[ ]
RE:26299 異常増殖No.26438
eigodoo1 さん 09/04/03 15:00
 
> 制御文字の、例えば\x1Fの制御文字があったとすると、画面上では、たしかに
>
>   「_」  (アンダースコアという文字)
>
> を白黒反転したような表示になると思いますが、これは別に、そこに「_」と
>いう文字があるという意味ではなくて、あくまで「\x1F」、つまり、文字コード
>が16進数で1Fの制御文字があることを無理矢理表現しているだけです。
>
> 制御文字というのは、基本的に、画面上での見える記号として表現することが
>難しい物なので、こういう無理矢理な表現をしています。(秀丸エディタでは)
>
> ちなみにメモ帳で開いてみると、制御文字の所は単に「・」のような感じで出
>てくるだけで、何があるのかよく分からないと思います。秀丸エディタでは、と
>りあえず制御文字があることが「反転」という見せ方によって分かる程度に表現
>しているつもりです。
>
> ということで、しつこく書かせていただきますけど、制御文字の所というのは、
>画面上に「_」のような文字があるように見えるとしても、そこに「_」という文
>字そのものが存在する訳ではありません。なので、例えば置換コマンドを使って
>「_」を何か他の文字に置き換えるような操作をしたとしても、\x1Fの制御文字
>が置換されることはありません。
>
> もしも、置換コマンドを使って\x1Fの制御文字を置換するとしたら、
>
> 検索:  \x1F
> 正規表現 = ON
>
> として置換する必要があります。例えば\x1Fの制御文字を削除したい場合なら、
>
> 検索:  \x1F
> 正規表現 = ON
>
> とした上で、置換文字列を空っぽにして置換コマンドを実行すればいいと思い
>ます。
>
> とにかく制御文字を全部削除したいということであれば、
>
> 検索:  [\x01-\x08\x0b\x0c\x0e-\x1f]
> 正規表現 = ON
>
> にして、置換文字列を空っぽにして実行すればいいと思います。


「」は制御文字なのに、上記の正規表現[\x01-\x08\x0b\x0c\x0e-\x1f]で、ヒットし
なかったのはなぜか?





[ ]