文字コードNo.01390
ひろ さん 03/03/13 12:04
 
 秀丸担当さん今日は、ひろです。
 文字コードについて次の機能が欲しいです。
(1)「文字コード」で UTF-8 のコードも表示
(2)ascii 関数の EUC, JIS, UTF-8, UNICODE 版

 UTF-7 はどんな時に使われているかも知らないので(^^;、お任せします。

[ ]
RE:01390 文字コードNo.01391
秀丸担当 さん 03/03/13 19:23
 
>(1)「文字コード」で UTF-8 のコードも表示

「文字コード表示」コマンドでしょうか。
UTF-8とUTF-7は文字コードというより、Unicodeのエンコード方法なので、
文字コードとして数値を表す種類のものではないと思います。
(秀丸の使う「文字コード」という用語も少し間違ってる気もしますが)
UTF-8は文字によってバイト数が違いますし、UTF-7は文字のある位置に
よって数値が違います。

>(2)ascii 関数の EUC, JIS, UTF-8, UNICODE 版
>
> UTF-7 はどんな時に使われているかも知らないので(^^;、お任せします。

EUC,JIS,UNICODEに関しては数値で表すことができますが、UTF-8,UTF-7
は数値で表すことができません。
EUC,JIS,UNICODEは検討しておきます。

[ ]
RE:01391 文字コードNo.01392
ひろ さん 03/03/13 19:54
 
 秀丸担当さん今日は、ひろです。
> >(1)「文字コード」で UTF-8 のコードも表示
>
> 「文字コード表示」コマンドでしょうか。
 そうです。
> UTF-8とUTF-7は文字コードというより、Unicodeのエンコード方法なので、
> 文字コードとして数値を表す種類のものではないと思います。
<中略>
> EUC,JIS,UNICODEに関しては数値で表すことができますが、UTF-8,UTF-7
> は数値で表すことができません。
 そうなんですか。

 私は HTML の <A href="〜"> といった URI の指定で、エンコードを行い
%FF に置き換えたいのです。しかし UTF-8 は一旦ファイル保存後、バイナ
リ・エディタでダンプ 16 進表記で確認というのは余りに煩雑なので、マクロ
に出来ないか? と考えました。

> EUC,JIS,UNICODEは検討しておきます。
 こちらは気長に待たせていただくとして、UTF-8 の場合何か良い方法は無い
でしょうか? ->ALL

[ ]
RE:01392 文字コードNo.01393
アルビレオ さん 03/03/14 00:27
 
アルビレオです。

> 私は HTML の <A href="〜"> といった URI の指定で、エンコードを行い
>%FF に置き換えたいのです。しかし UTF-8 は一旦ファイル保存後、バイナ
>リ・エディタでダンプ 16 進表記で確認というのは余りに煩雑なので、マクロ
>に出来ないか? と考えました。
>
>> EUC,JIS,UNICODEは検討しておきます。
> こちらは気長に待たせていただくとして、UTF-8 の場合何か良い方法は無い
>でしょうか? ->ALL

文字のunicodeを返す関数が追加されれば、このあたりを参考にマクロでなんと
かできそうです。

UTF-8: http://www.linux.or.jp/JM/html/LDP_man-pages/man7/utf-8.7.html
UTF全般: http://seclan.dll.jp/ccutffaq.htm

[ ]
RE:01392 文字コードNo.01394
でるもんた さん 03/03/14 09:46
 
でるもんたです。

> > UTF-8とUTF-7は文字コードというより、Unicodeのエンコード方法なので、
> > 文字コードとして数値を表す種類のものではないと思います。
> <中略>
> > EUC,JIS,UNICODEに関しては数値で表すことができますが、UTF-8,UTF-7
> > は数値で表すことができません。
>  そうなんですか。

うーん、ちょっと違うような気がします。UTF-8 も必ず 1 文字が 3 バイト
(文字種によっては 2〜6 バイト)に対応しますから、表現可能だとは思う
んです。たとえば、全角スペースは UNICODE(UCS-2)で 0x3000、UTF-8 で
E38080 ですよね。

> > EUC,JIS,UNICODEは検討しておきます。
>  こちらは気長に待たせていただくとして、UTF-8 の場合何か良い方法は無い
> でしょうか? ->ALL

UCS-2 と UTF-8 の相互変換は簡単な計算だけで済みますから(といいつつ、
自分は計算式を知らないのですが)、UCS-2 で文字コードを受け取って自分で
計算するのが手っ取り早いのではないでしょうか。

[ ]
RE:01393 文字コードNo.01395
ひろ さん 03/03/14 12:34
 
 アルビレオさん、でるもんたさん今日は、ひろです。
> 文字のunicodeを返す関数が追加されれば、このあたりを参考にマクロでなんと
> かできそうです。
>
> UTF-8: http://www.linux.or.jp/JM/html/LDP_man-pages/man7/utf-8.7.html
> UTF全般: http://seclan.dll.jp/ccutffaq.htm

> UCS-2 と UTF-8 の相互変換は簡単な計算だけで済みますから(といいつつ、
> 自分は計算式を知らないのですが)、UCS-2 で文字コードを受け取って自分で
> 計算するのが手っ取り早いのではないでしょうか。
 この辺りの WEB やキーワードを参考にしてみます。
 情報有り難うございました。

[ ]
RE:01394 文字コードNo.01396
秀丸担当 さん 03/03/17 18:55
 
>うーん、ちょっと違うような気がします。UTF-8 も必ず 1 文字が 3 バイト
>(文字種によっては 2〜6 バイト)に対応しますから、表現可能だとは思う
>んです。たとえば、全角スペースは UNICODE(UCS-2)で 0x3000、UTF-8 で
>E38080 ですよね。

確かに、UCS-2の場合3バイトに収まるので、秀丸の数値型変数に収めること
は可能です。
無いよりかはあったほうが便利でしょうか。

[ ]
RE:01396 文字コードNo.01397
ひろ さん 03/03/17 19:29
 
 秀丸担当さん今日は、ひろです。
> 確かに、UCS-2の場合3バイトに収まるので、秀丸の数値型変数に収めること
> は可能です。
> 無いよりかはあったほうが便利でしょうか。
 便利です(^^)。

[ ]