ユニコード(utf8)の表示No.09082
マボカル さん 06/02/03 23:49
 
マボカルと申します。秀丸英語版5.14betaを入れて使っていますが、
WORD2003や韓国のユニコード対応のソフトでは表示されて
秀丸英語版ではフォントがMS Gothicの状態で「□」のに文字化け
する文字が一部あります。

私の調べたところ、fa30からfa6aまでの文字だと思いますが、厳密
には文字化けではなく、文字が表示されないだけであって文字コード値
などの属性は保たれています。ですから秀丸エディタでは「□」で
あっても、WORDとかに貼り付けると該当する文字が表示されます。

クリップボード履歴にも同じように出ますので、フォント選択云々の
問題ではないのでしょうか?ちなみにこの範囲の文字はIEでも「□」
になります。

WORDも韓国語版であり、韓国のユニコード対応のワードプロセッ
サーも勿論韓国版ですから、何か関係がありそうな気がしますがよく
分かりません。

F900-FAFFの範囲の項目は「CJK Compatibility Ideographs」と
ありますが、http://www.nii.ac.jp/CAT-ILL/PUB/font/www/table/
これってでも中日韓で使われる漢字をひっくるめて統合した項目の
一つですよね。どうして秀丸エディタでは文字化けして、WORD
とかでは文字化けしないんでしょうか?日本版WORDではどのように
表示されますか?

しかしユニコードはよく分からん・・・。

ご確認お願いします。
 

[ ]
RE:09082 ユニコード(utf8)の表示No.09086
秀丸担当 さん 06/02/06 14:12
 

確認してみまたところ、Unicodeでfa30からfa6aの文字はほとんどのフォントに
は文字がありませんでした。

自分のマシンに入っている全てのフォントを確認してみたところ、たまたま入っ
ていたY.OzFontNBというフォントだけが、唯一表示することができま
した。

IEでもWord2000でも、MS ゴシックで表示できませんでした。
FireFoxではこのコードの文字だけがY.OzFontNBになって表示可能と
なっていました。

いろいろ調べてみて、fa30からfa6aの文字は二重に定義されていて、例えばfa30
と4faeは「侮」という字として同一視していいのかとも思いましたが。
fa30のほうは「侮」の中の母の字が4faeとは違うのでしょうか。
規格によれば同一視してもよいと思われるのですが、Y.OzFontNBでは
なぜか違います。やっぱり違うのでしょうか。

秀丸エディタとしては、フォントが対応していれば表示されるという単純な対応
としたいところです。

[ ]
RE:09086 ユニコード(utf8)の表示No.09087
マボカル さん 06/02/08 19:00
 
秀丸担当さん

ご回答ありがとうございます。

>確認してみまたところ、Unicodeでfa30からfa6aの文字はほとんどのフォントに
>は文字がありませんでした。

そうでしたか。文字に対応するフォントがなかったのですね。

>自分のマシンに入っている全てのフォントを確認してみたところ、たまたま入っ
>ていたY.OzFontNBというフォントだけが、唯一表示することができま
>した。

>IEでもWord2000でも、MS ゴシックで表示できませんでした。
>FireFoxではこのコードの文字だけがY.OzFontNBになって表示可能と
>なっていました。

韓国語XPに入っているWORD2003と、韓国のソフト「アレア
ハングル2005」ではどのフォントでも表示されます。もちろん
MS Gothic とか MS Mincho なども同様に表示されてしまいます。
WORDに関していえばバージョンの違いでしょうか?それとも韓国語
版だから表示できるのでしょうか?不思議で仕方がありません。
ちなみに秀丸英語版で韓国語のフォントに変えても表示されません。

>いろいろ調べてみて、fa30からfa6aの文字は二重に定義されていて、例えばfa30
>と4faeは「侮」という字として同一視していいのかとも思いましたが。
>fa30のほうは「侮」の中の母の字が4faeとは違うのでしょうか。
>規格によれば同一視してもよいと思われるのですが、Y.OzFontNBでは
>なぜか違います。やっぱり違うのでしょうか。

「侮」の字のように同形の漢字が別の文字コードとして登録されている
ものはほかにもあります。これは韓国の文字コード体系に由来する
もので、日本語で例えるなら音読みが2種類ある漢字は、それぞれの
読み方に応じて同じ漢字であっても別個の文字コードを割り当てて
います。極めつけは「樂」の漢字で、韓国語では4通りの読み方が
できますから、それぞれ f914, 6a02, f95c, f9bf の文字コードが
割り当てられています。

>秀丸エディタとしては、フォントが対応していれば表示されるという単純な対応
>としたいところです。

なんだかまだ疑問だらけですが、表示されないといって、すぐに問題に
なるものでもありませんから了解しました。ありがとうございました。

[ ]