|
こんにちはマボカルと申します。
SJISにある日本語相当の文字に対してユニコードでのコード値を
付けて、その結果を別の作業に利用しようとしています。いちいち
一つ一つの文字を
http://www.nii.ac.jp/CAT-ILL/PUB/font/www/table/
のようなサイトから検索してコード値を探すのは大変なので、以下の
ようなマクロを動かしてiniファイルリストによるコード値付けを
行おうとしています。
//sample.txt
ハ
ヒ
フ
ヘ
ホ
// 060308.mac
down;
while (result) {
golineend;
insert getinistr(currentmacrodirectory + "\\utf8.ini", "utf8", gettext(0,
y, x, y));
down;
}
//utf8.ini
[utf8]
ア=\u30A2
ィ=\u30A3
イ=\u30A4
ゥ=\u30A5
ウ=\u30A6
ェ=\u30A7
エ=\u30A8
ォ=\u30A9
オ=\u30AA
カ=\u30AB
ガ=\u30AC
キ=\u30AD
ギ=\u30AE
ク=\u30AF
グ=\u30B0
ケ=\u30B1
ゲ=\u30B2
コ=\u30B3
ゴ=\u30B4
サ=\u30B5
ザ=\u30B6
シ=\u30B7
ジ=\u30B8
ス=\u30B9
ズ=\u30BA
セ=\u30BB
ゼ=\u30BC
ソ=\u30BD
ゾ=\u30BE
タ=\u30BF
ダ=\u30C0
チ=\u30C1
ヂ=\u30C2
ッ=\u30C3
ツ=\u30C4
ヅ=\u30C5
テ=\u30C6
デ=\u30C7
ト=\u30C8
ド=\u30C9
ナ=\u30CA
ニ=\u30CB
ヌ=\u30CC
ネ=\u30CD
ノ=\u30CE
ハ=\u30CF
バ=\u30D0
パ=\u30D1
ヒ=\u30D2
ビ=\u30D3
ピ=\u30D4
フ=\u30D5
ブ=\u30D6
プ=\u30D7
ヘ=\u30D8
ベ=\u30D9
ペ=\u30DA
ホ=\u30DB
ボ=\u30DC
ポ=\u30DD
マ=\u30DE
ミ=\u30DF
ム=\u30E0
メ=\u30E1
モ=\u30E2
ャ=\u30E3
ヤ=\u30E4
ュ=\u30E5
ユ=\u30E6
ョ=\u30E7
ヨ=\u30E8
ラ=\u30E9
リ=\u30EA
ル=\u30EB
レ=\u30EC
ロ=\u30ED
ヮ=\u30EE
ワ=\u30EF
ヰ=\u30F0
ヱ=\u30F1
ヲ=\u30F2
ン=\u30F3
ヴ=\u3094
ヴ=\u30F4
ヵ=\u30F5
ヶ=\u30F6
iniファイルリストは実際にはひらがな・漢字・記号等を含めて7千行
近くになりますが、一部だけ載せました。
このようなiniファイルとマクロを作って上のようなsample.txtの
ファイルに対して実行すると、iniファイルで定義されたコード値とは
別のコード値がついてしまうものがあります。分かりやすいように
sample.txtでは「ハヒフヘホ」だけをあげていますが、適当に日本語の
文章をタイプして、それを一文字ずつ改行した後、マクロを実行すると
これ以外にも漢字や記号など、全く別のコード値がついてしまうものが
あります。ちなみに「ハヒフヘホ」の場合、付与されるコード値が
「クゲサジセ」の結果になります。
正しい結果がでるものとそうでないものがあるのはどうしてなの
でしょうか。何かバグっぽい感じもしているので、2.秀丸エディタ&
関連ソフト情報交換の会議室に質問しようかとも考えましたが、
マクロやiniファイルの基本的なことが分かっていないミスかもしれ
ませんので、まずここで質問させていただきます。ご教授よろしく
お願いします。
動作環境は韓国語版XP+英語版秀丸Ver6bです。
|
|