サロゲートペアNo.00604
ぱるぷんて さん 07/03/24 07:50
 
6.5βでは、サロゲートペアがサポートされています。サロゲートペアの補助漢字は、
正しく表示されますが、結合文字("か゜JIS 1-4-87"等)が正しく表示されません。
ちなみに、結合文字の場合は、文字の右にカーソルをおいてBSキーを押下すると、結
合文字ではないもとの文字(たとえば、"か゜JIS 1-4-87"の場合は"か")に戻ります。
また、対応する文字のUCS-4コードはありませんからUTF-8でエンコードする場合は、
UTF-16をそれぞれエンコードすることになるようです。VistaのNotepadで動作が確認
できます。対応をよろしくお願いします。

[ ]
RE:00604 サロゲートペアNo.00612
秀丸担当 さん 07/03/26 09:50
 

>6.5βでは、サロゲートペアがサポートされています。サロゲートペアの補助漢字は、
>正しく表示されますが、結合文字("か゜JIS 1-4-87"等)が正しく表示されません。
>ちなみに、結合文字の場合は、文字の右にカーソルをおいてBSキーを押下すると、結
>合文字ではないもとの文字(たとえば、"か゜JIS 1-4-87"の場合は"か")に戻ります。
>また、対応する文字のUCS-4コードはありませんからUTF-8でエンコードする場合は、
>UTF-16をそれぞれエンコードすることになるようです。VistaのNotepadで動作が確認
>できます。対応をよろしくお願いします。

そういうものがあるのですか。
サロゲートペアとはまた別のことのようですね。
タイ語の発音記号(?)は似たような感じで合体させていたりしているのに対応し
ていますが、それ以外については対応していないです。
とりあえずV6.50は安定させたいので、今後の課題とさせていただきたいと思い
ます。

[ ]
RE:00612 サロゲートペアNo.00620
ぱるぷんて さん 07/03/27 10:32
 
>そういうものがあるのですか。
>サロゲートペアとはまた別のことのようですね。
>タイ語の発音記号(?)は似たような感じで合体させていたりしているのに対応し
>ていますが、それ以外については対応していないです。
>とりあえずV6.50は安定させたいので、今後の課題とさせていただきたいと思い
>ます。

了解しました。よろしくお願いします。

「サロゲートペア」とは、Surrogate Code Point(U+D800〜U+DFFF)を持つ文字と言う
ことだったんですね。

JIS2004では、漢字以外にも、「か゜」や「カ゜」などのひらがなも追加されていま
す。従来、濁点/半濁点文字はUNICODEでそれぞれコードが割り当てられていました
が、追加文字は「結合文字」として定義されました。

私には、発音できないのですが、NHKのアナウンサーは使い分けられるそうです。

(結合文字に関しては、http://go.microsoft.com/fwlink/?LinkId=78800 を参照くだ
さい)

[ ]
RE:00620 サロゲートペアNo.00623
秀丸担当 さん 07/03/27 16:57
 

情報ありがとうございます。
参考にさせていただきます。

[ ]