要望: 変換できない文字No.03955
Arimac さん 04/01/30 11:04
 
エンコードを変えた時に変換できない文字は「?」になりますが、
これを「&#[x][Nummer];」の形式にするオプションがあると
大変有用だと思います。

例えば「・」は簡体字にもあるのにShift_JISからは自動的には
変換されません。これが「&#x30fb」という感じになっていると
1発で変換できて便利です。

[ ]
RE:03955 要望: 変換できない文字No.03958
秀丸担当 さん 04/01/30 19:18
 
>エンコードを変えた時に変換できない文字は「?」になりますが、
>これを「&#[x][Nummer];」の形式にするオプションがあると
>大変有用だと思います。

確かに、自分でテストしていても、それがあれば有用な気もします。
ただ、テキストファイルとしてまるで独自の形式を作っているようで、テキスト
エディタとしてやってしまっていいものかという感じがします。

[ ]
RE:03958 要望: 変換できない文字No.03963
Arimac さん 04/01/31 02:54
 
テキストエディタであるからこそ可視である文字列「&#[x][Nummer];」に
変換するのであって、独自の形式を取る事が可能な専用のソフトであれば
変換できない文字を色を変えたり強調表示したりすると思います。

あくまでも文字列を扱うという姿勢さえあればテキストエディタとして
通用するような気がします。

[ ]
RE:03963 要望: 変換できない文字No.03965
Iranoan さん 04/01/31 17:07
 
 Arimacさん今日は、Iranoan です。
> 「&#[x][Nummer];」に
> 変換する
 これだと元々この形式で書いてあった文字列との区別がつかなくなりますよ
ね。それはよいのでしょうか?

[ ]
RE:03965 要望: 変換できない文字No.03966
でるもんた さん 04/01/31 20:56
 
でるもんたです。横槍失礼。

> > 「&#[x][Nummer];」に
> > 変換する
>  これだと元々この形式で書いてあった文字列との区別がつかなくなりますよ
> ね。それはよいのでしょうか?

強制ではなくオプションで、ということでしたら、それでかまわないと思います。
私からもこの機能を要望させていただきます。

[ ]
RE:03965 要望: 変換できない文字No.03967
Arimac さん 04/01/31 23:57
 
「?」になってしまうよりは遥かにましかと(^^;

それと元の字は結局、前のテキストを見ないとわからないので
元々「&#[x][Nummer];」で書いてあったかはその時に
わかると思います。
ようするに文字を区別したいということです。

ちょっと閃いたのですが、エンコードを切り替えた時に
変換できない文字はマクロで検出できるのではないかな
と思いました。そうするとunicodeで取ってきて自力で
上記形式に変換できるかも。

今はノートパソコンのWindows Meで多言語にしてない
ので試せないので・・・
(月曜日に会社に行けば試せる)

[ ]
RE:03967 要望: 変換できない文字No.03968
アルビレオ さん 04/02/01 05:02
 
アルビレオです。

>「?」になってしまうよりは遥かにましかと(^^;
>
>それと元の字は結局、前のテキストを見ないとわからないので
>元々「&#[x][Nummer];」で書いてあったかはその時に
>わかると思います。
>ようするに文字を区別したいということです。

元々「&#[x][Nummer];」だった文字列と区別がつかないことと、変換前のテキス
トを見ないとわからないことは別の話です。
特定の文字を勝手に別の文字列に置き換えてしまうのは、プレーンなテキストエ
ディタとしては問題があるでしょう。
でるもんたさんが書かれているように、オプションとするなら私も反対しません
が。

やるとしたらエンコードを切り替えたときだけでなく、クリップボードからの貼
り付けやカーソル位置への読み込みにも対応しないと片手落ちですね。
さすがに検索まで対応させるのは無理でしょうけど。
(できれば双方向も…と考えましたが、元のエンコード形式を覚えておかないと
無理ですね)

[ ]
RE:03968 要望: 変換できない文字No.03969
Arimac さん 04/02/01 12:00
 
>特定の文字を勝手に別の文字列に置き換えてしまうのは、プレーンなテキストエ
>ディタとしては問題があるでしょう。

それは今でもやってる(「?」への変換)事でしょう。

>でるもんたさんが書かれているように、オプションとするなら私も反対しません
>が。

オプションというのは私の最初の書き込みにもあります。

>やるとしたらエンコードを切り替えたときだけでなく、クリップボードからの貼
>り付けやカーソル位置への読み込みにも対応しないと片手落ちですね。

変換できない文字が「?」になるタイミングは保存の時だと思うのですが?

[ ]
RE:03968 要望: 変換できない文字No.03970
Arimac さん 04/02/01 12:35
 
確かV3.xxの頃の「unicodeを使用可能にする」をoffにしていて
SJISに無い文字を貼り付けた時に「?」になっていたような
気がするのですが、それと勘違いをしているような気がします。

V4.xxではどうも「unicodeを使用可能にする」は無くなって
何時でもonになってるような・・・
そのためか、V4.xxでは編集中では現在のエンコードに無い
文字でもunicodeで表示しているみたいです。
(「?」にはならない)

[ ]
RE:03967 要望: 変換できない文字No.03971
Iranoan さん 04/02/01 17:53
 
 Arimacさん今日は、Iranoan です。
> 「?」になってしまうよりは遥かにましかと(^^;
 確かに「?」では元々「?」の文字と区別がつかないので、その意味では同じ
ですね。

> ただ、テキストファイルとしてまるで独自の形式を作っているようで、テキスト
> エディタとしてやってしまっていいものかという感じがします。
 秀丸担当さんのこの意見も解りますが、(制御コードを使うなどして) やは
り何か区別が付けられた方がよい気がしています。

[ ]
RE:03958 要望: 変換できない文字No.03973
Arimac さん 04/02/01 19:02
 
気付かれてはいると思いますが、「&#[x][Nummer];」というのはHTML4の文字実体参
照です(^^;
(別に独自って訳では・・・)
それとどうやら参照した文書が英語じゃなかった(.de)ようでNummer→Numberです(^^;

[ ]
RE:03958 要望: 変換できない文字No.03976
Arimac さん 04/02/02 10:10
 
マクロでできました。
エンコードの切り替えで「内容を維持したまま適用」して以下のマクロを実行。

#n = 0;
gofiletop;
#r = 1;
while (#r) {
    #c = code;
    if (#c == eof) break;
    if (#c == 0) {
        #u = unicode;
        if (#u == 0) {
            right;
            #r = result;
        } else {
            delete;
            insert "&#" + str(#u) + ";";
            #n = #n + 1;
        }
    } else {
        right;
        #r = result;
    }
}
message str(#n) + "個置換しました。";

[ ]
RE:03976 要望: 変換できない文字No.03979
秀丸担当 さん 04/02/02 17:29
 

>マクロでできました。

やはり、テキストエディタとしてのやるのは問題がある気がするので、慎重に考
えたいと思います。
マクロでもできるということで、とりあえずはマクロで対応していただきたいと
思います。

[ ]
RE:03979 要望: 変換できない文字No.03984
Arimac さん 04/02/02 18:35
 
マクロで出来るかどうかを検討してから投稿すべきだったかなぁ?と感じています。
どうもお騒がせしました。
同様の要望があればこの手で回避可能ということが分かったのは良かったかも・・・
(^^;;

[ ]