漢字のコード値を求める方法
No.04495
マボカル
さん 04/10/13 00:29
マボカルと申します。どこへ投稿したらいいのか迷いましたが、
こちらのフォーラムへ投稿いたします。
ユニコードの問題について調べなければならないことがあり、
現在問題となりそうな漢字を絞りこんでいます。そこで私が知りたい
ことは、ある漢字がどういうコード値をもっているかということです。
見た目で違いの分かる漢字だとそう問題はありませんが、見た目は
同じでも実はコード値が違うといったものは、非常に厄介なものです。
例えば「楽」という漢字にしても、新字体・旧字体があって、旧字体の
中でもいろいろなコード値が存在します。
http://community.freechal.com/ComService/Activity/PDS/CsPDSContent.asp?GrpId
=2806427&ObjSeq=1&PageNo=1&DocId=27552764
コード値の確認は例えばMSワードなどではキーボードからでなく
文字コード表から選択して入力する方法をとった場合、その文字
コードから特定の文字を選択すると、画面の下のほうに選択した文字
コードが示されるといった機能があります。こういった機能はその他の
ワードプロセッサーについても同様の機能があると思います。
秀丸にそのような機能があるかどうかは分かりませんが、私の求める
ことはそういった機能というより、テキスト化された漢字リストを
対象にして、コード値を求め、そのコード値を漢字の横に書き込んで
くれる機能です。
よくサイトの中で、文字コード一覧表をあげているのを見ますが、
http://ash.or.jp/code/unitbl22.htm
ああいうものは、どうやってそのコード値を出したものなので
しょうか。秀丸の機能&マクロでは対応できないものなのでしょうか。
ご教授よろしくお願いします。
[
△
]
RE:04495 漢字のコード値を求める方法
No.04496
ENCODINGSHIFTJIS
さん 04/10/13 11:18
秀丸マクロでは カーソル位置のコードは 2種取れます
表示は10進数
insert "u"+str(unicode)+"sjis"+str(code)+" ";
表示は16進数
insert "u"+hex(unicode)+"sjis"+hex(code)+" ";
UTF-8 UTF-16 は前処理が必要です
[
△
]
RE:04496 漢字のコード値を求める方法
No.04497
マボカル
さん 04/10/13 12:19
ENCODINGSHIFTJISさん
ご回答有難うございました。いつも大変お世話になっております。
>秀丸マクロでは カーソル位置のコードは 2種取れます
>表示は10進数
>insert "u"+str(unicode)+"sjis"+str(code)+" ";
>表示は16進数
>insert "u"+hex(unicode)+"sjis"+hex(code)+" ";
>
>UTF-8 UTF-16 は前処理が必要です
こんな簡単な文で文字コードを確認できるわけですね。それから
カーソル位置の文字コードという定義は、対象文字の前にあるカーソル
を意味しているわけですね。大変参考になりました。色々と改造して
みます。
[
△
]