要望 対応文字コードの追加No.03505
colder さん 09/09/01 12:58
 
秀丸で、JIS X 0213(SHIFT_JIS-2004、EUC-JP-2004、ISO-2022-JP-2004)及び、
UTF-32(ビッグエンディアン、リトルエンディアン)でエンコードされたファイルを
編集できるようにならないでしょうか。
検討、お願いします。

[ ]
RE:03505 要望 対応文字コードの追加No.03516
秀丸担当 さん 09/09/01 17:56
 

>秀丸で、JIS X 0213(SHIFT_JIS-2004、EUC-JP-2004、ISO-2022-JP-2004)及び、
>UTF-32(ビッグエンディアン、リトルエンディアン)でエンコードされたファイルを
>編集できるようにならないでしょうか。

JIS X 0213:2004 について調べてみましたが、追加された10文字というのがある
のがわかりました。
Shift-JISでは
0x879F 0x889E 0x9873 0x989E 0xEAA5 0xEFF8 0xEFF9 0xEFFA 0xEFFB 0xEFFC
の文字コードの文字ということになるようです。
Vista以降ではJIS2004対応フォントということで、Vistaのメモ帳でShift-JISで
確認してみましたが、この文字は現れませんでした。
資料は見受けられるものの、確かにこの文字コードが存在するのかどうかを実際
のソフト上で確認することができず、もし関連する情報をご存知でしたら教えて
いただけると助かります。

Unicodeでは同じ文字相当のものは秀丸エディタでも見ることができました。

そういうことではなくて、JIS2004のグリフ(文字の形)の変更のこと(例えば
「辻」の点の数)だとしたら、特に対応の必要なく、秀丸エディタでもできてい
るようです。

UTF-32は、通常はテキストファイルとして使うことはあまりなく特殊な用途でし
か使うことはないと思いますが、今後のネタとして参考にさせていただきます。

[ ]
RE:03516 要望 対応文字コードの追加No.03522
colder さん 09/09/01 22:04
 
>JIS X 0213:2004 について調べてみましたが、追加された10文字というのがある
>のがわかりました。
>Shift-JISでは
>0x879F 0x889E 0x9873 0x989E 0xEAA5 0xEFF8 0xEFF9 0xEFFA 0xEFFB 0xEFFC
>の文字コードの文字ということになるようです。
>Vista以降ではJIS2004対応フォントということで、Vistaのメモ帳でShift-JISで
>確認してみましたが、この文字は現れませんでした。

ええっと、秀丸エディタの対応しているSHIFT_JISはJIS X 0208の文字に
IBM拡張漢字を加えたものと認識しているんですけど、この認識は間違っていますか?
JIS X 0213:2004で追加された10文字以前に、
JIS X 0213:2000で追加された文字(非漢字:659字、第三水準:1,249字、第四水準:2,4
36字)を、
こちらの環境(XP)では、SHIFT_JISエンコーディングで保存することも、読むことも
出来ません。
ひょっとして、Vista以降では、扱えるのでしょうか?
以下のサイトにUnicodeとの対応表があります。
http://x0213.org/codetable/

>UTF-32は、通常はテキストファイルとして使うことはあまりなく特殊な用途でし
>か使うことはないと思いますが、今後のネタとして参考にさせていただきます。
UTF-32については、他のいくつかのエディタでは扱うことが出来るので、秀丸エディ
タでも扱えたらいいなぁと思ったのですが、
いつか扱えるようになることを期待しています。

[ ]
RE:03522 要望 対応文字コードの追加No.03525
アルビレオ さん 09/09/01 23:11
 
横から失礼します。
ユーザーのアルビレオです。

>こちらの環境(XP)では、SHIFT_JISエンコーディングで保存することも、読むことも
>出来ません。
>ひょっとして、Vista以降では、扱えるのでしょうか?

「読むことができない」とは具体的にどのような状態なのかわかりにくいです。

試しにVistaのメモ帳と秀丸でバイナリエディタを使って該当するコードをいく
つか並べたテキストを作成して読み込んでみたところ、秀丸担当さんと同じく

JIS X 0208-1983 OK
JIS X 0208-1990 OK
JIS X 0213:2000 NG(・で表示)
JIS X 0213:2004 NG(・で表示)

という結果でした。
フォントもTahomaやメイリオなど何種類か切り替えてみましたが結果は同じ。

おそらくフォントセットの方が追加文字に対応していないので、対応したフォン
トを入手ないことにはどうしようもないと思います。
たぶんIMEも追加文字には未対応で入力できないんじゃないでしょうか。

[ ]
RE:03525 要望 対応文字コードの追加No.03530
colder さん 09/09/02 00:10
 
>「読むことができない」とは具体的にどのような状態なのかわかりにくいです。

意図した文字で表示されないという意味です。

>おそらくフォントセットの方が追加文字に対応していないので、対応したフォン
>トを入手ないことにはどうしようもないと思います。
>たぶんIMEも追加文字には未対応で入力できないんじゃないでしょうか。

フォントセットの中に存在しない文字はしょうがないですが、
JIS X 0213で追加された文字の多くは補助漢字にも登録されているので、
その範囲の文字であれば表示することは可能ではないでしょうか。

[ ]
RE:03530 要望 対応文字コードの追加No.03535
秀丸担当 さん 09/09/02 09:54
 

>ええっと、秀丸エディタの対応しているSHIFT_JISはJIS X 0208の文字に
>IBM拡張漢字を加えたものと認識しているんですけど、この認識は間違っていますか?

Shift-JIS に関しては、フォントのShift-JIS文字セットの生のままになります。
フォントの文字セットにその文字があれば表示されることになると思います。
EUCとJISに関しては JIS X 0212 の補助漢字のデコードに対応しています。


>JIS X 0213:2004で追加された10文字以前に、
>JIS X 0213:2000で追加された文字

そういうことでしたか。言われていることを理解できました。
調べてみたところ、いろいろ厄介なことがありそうです。

Vista以降では、フォントのUnicode文字セットには JIS X 0213 が含まれている
ようですが、Shift-JIS文字セットには含まれていないようです。
SHIFT_JIS-2004は外字領域0xF000〜ともかぶるようで、MicrosoftはSHIFT_JIS-
2004を採用していないようです。
Microsoftが採用していれば生の文字セットを使うだけでよかったのですが、そう
ではないので、サポートするとすれば各アプリケーション側でUnicodeに変換して、
さらにサロゲートペアと結合文字にも変換しなくてはいけないということのよう
です。

秀丸エディタとしてはEUCとJISの補助漢字でも似たようなことをしているので、
できないことはないと思いますが、そういうネタということにさせていただきた
いと思います。

フォントのShift-JIS文字セットに入ることを期待したいのですが、Windows7でも
採用されていないようで、やはりアプリケーション側の対応が必要なようです。

[ ]
RE:03516 要望 対応文字コードの追加No.03733
colder さん 09/09/09 13:12
 
望外の早さでUTF-32に対応していただきありがとうございました。

[ ]