漢字のコード値を求める方法No.04495
マボカル さん 04/10/13 00:29
 
マボカルと申します。どこへ投稿したらいいのか迷いましたが、
こちらのフォーラムへ投稿いたします。

ユニコードの問題について調べなければならないことがあり、
現在問題となりそうな漢字を絞りこんでいます。そこで私が知りたい
ことは、ある漢字がどういうコード値をもっているかということです。
見た目で違いの分かる漢字だとそう問題はありませんが、見た目は
同じでも実はコード値が違うといったものは、非常に厄介なものです。

例えば「楽」という漢字にしても、新字体・旧字体があって、旧字体の
中でもいろいろなコード値が存在します。

http://community.freechal.com/ComService/Activity/PDS/CsPDSContent.asp?GrpId
=2806427&ObjSeq=1&PageNo=1&DocId=27552764

コード値の確認は例えばMSワードなどではキーボードからでなく
文字コード表から選択して入力する方法をとった場合、その文字
コードから特定の文字を選択すると、画面の下のほうに選択した文字
コードが示されるといった機能があります。こういった機能はその他の
ワードプロセッサーについても同様の機能があると思います。

秀丸にそのような機能があるかどうかは分かりませんが、私の求める
ことはそういった機能というより、テキスト化された漢字リストを
対象にして、コード値を求め、そのコード値を漢字の横に書き込んで
くれる機能です。

よくサイトの中で、文字コード一覧表をあげているのを見ますが、

http://ash.or.jp/code/unitbl22.htm

ああいうものは、どうやってそのコード値を出したものなので
しょうか。秀丸の機能&マクロでは対応できないものなのでしょうか。

ご教授よろしくお願いします。

[ ]
RE:04495 漢字のコード値を求める方法No.04496
ENCODINGSHIFTJIS さん 04/10/13 11:18
 
秀丸マクロでは カーソル位置のコードは 2種取れます

表示は10進数
insert "u"+str(unicode)+"sjis"+str(code)+" ";
表示は16進数
insert "u"+hex(unicode)+"sjis"+hex(code)+" ";

UTF-8 UTF-16 は前処理が必要です

[ ]
RE:04496 漢字のコード値を求める方法No.04497
マボカル さん 04/10/13 12:19
 
ENCODINGSHIFTJISさん

ご回答有難うございました。いつも大変お世話になっております。

>秀丸マクロでは カーソル位置のコードは 2種取れます
>表示は10進数
>insert "u"+str(unicode)+"sjis"+str(code)+" ";
>表示は16進数
>insert "u"+hex(unicode)+"sjis"+hex(code)+" ";
>
>UTF-8 UTF-16 は前処理が必要です

こんな簡単な文で文字コードを確認できるわけですね。それから
カーソル位置の文字コードという定義は、対象文字の前にあるカーソル
を意味しているわけですね。大変参考になりました。色々と改造して
みます。

[ ]