サロゲートペア
No.00604
ぱるぷんて
さん 07/03/24 07:50
6.5βでは、サロゲートペアがサポートされています。サロゲートペアの補助漢字は、
正しく表示されますが、結合文字("か゜JIS 1-4-87"等)が正しく表示されません。
ちなみに、結合文字の場合は、文字の右にカーソルをおいてBSキーを押下すると、結
合文字ではないもとの文字(たとえば、"か゜JIS 1-4-87"の場合は"か")に戻ります。
また、対応する文字のUCS-4コードはありませんからUTF-8でエンコードする場合は、
UTF-16をそれぞれエンコードすることになるようです。VistaのNotepadで動作が確認
できます。対応をよろしくお願いします。
[
△
]
RE:00604 サロゲートペア
No.00612
秀丸担当
さん 07/03/26 09:50
>6.5βでは、サロゲートペアがサポートされています。サロゲートペアの補助漢字は、
>正しく表示されますが、結合文字("か゜JIS 1-4-87"等)が正しく表示されません。
>ちなみに、結合文字の場合は、文字の右にカーソルをおいてBSキーを押下すると、結
>合文字ではないもとの文字(たとえば、"か゜JIS 1-4-87"の場合は"か")に戻ります。
>また、対応する文字のUCS-4コードはありませんからUTF-8でエンコードする場合は、
>UTF-16をそれぞれエンコードすることになるようです。VistaのNotepadで動作が確認
>できます。対応をよろしくお願いします。
そういうものがあるのですか。
サロゲートペアとはまた別のことのようですね。
タイ語の発音記号(?)は似たような感じで合体させていたりしているのに対応し
ていますが、それ以外については対応していないです。
とりあえずV6.50は安定させたいので、今後の課題とさせていただきたいと思い
ます。
[
△
]
RE:00612 サロゲートペア
No.00620
ぱるぷんて
さん 07/03/27 10:32
>そういうものがあるのですか。
>サロゲートペアとはまた別のことのようですね。
>タイ語の発音記号(?)は似たような感じで合体させていたりしているのに対応し
>ていますが、それ以外については対応していないです。
>とりあえずV6.50は安定させたいので、今後の課題とさせていただきたいと思い
>ます。
了解しました。よろしくお願いします。
「サロゲートペア」とは、Surrogate Code Point(U+D800〜U+DFFF)を持つ文字と言う
ことだったんですね。
JIS2004では、漢字以外にも、「か゜」や「カ゜」などのひらがなも追加されていま
す。従来、濁点/半濁点文字はUNICODEでそれぞれコードが割り当てられていました
が、追加文字は「結合文字」として定義されました。
私には、発音できないのですが、NHKのアナウンサーは使い分けられるそうです。
(結合文字に関しては、
http://go.microsoft.com/fwlink/?LinkId=78800
を参照くだ
さい)
[
△
]
RE:00620 サロゲートペア
No.00623
秀丸担当
さん 07/03/27 16:57
情報ありがとうございます。
参考にさせていただきます。
[
△
]