| |
滝澤です。
On Mon, Oct 16, 2000 at 09:31:06AM +0900,
斉藤秀夫 wrote:
> 文字コードの件ですが、僕自身あまり文字コードに詳しくないので、例えば中国語
> の場合はどういう形で2バイトになっているのかとかも知らないし、どうやったらテ
> ストできるのかも知らないし、どの程度大変なのかすら分からないです。とりあえず
> そういう関係の知識を身につけて、どの程度大変かを見積もってから考えたい所で
>す。
国際化=あらゆる言語に対応
とは考えなくてもいいと思います。
必要なのは国際化の枠組みを用意することです。
だから最初から中国語を扱おうなんて考えなくてもいいと思います。
国際化の枠組みの中で日本語と英語だけを扱うでもいいと思います。
そのうち開発に余裕が出たら、他の言語に対応すればいいのです。
ということで、その最低限の準備段階として、他の人も書かれていますが、
メッセージは文字コードの変換をせずにオリジナルのまま扱って欲しいと
思います。
# 一度、誤変換したら後戻りができないのですから。
後、文字コードに関する参考文献などをあげてみたいと思います。
# 余計なおせっかいだとは思いますが。
文字コードに関する参考書
- 「文字コードの世界」安岡孝一、安岡素子著、東京電機大学出版局
http://www.dendai.ac.jp/press/book_da/ISBN4-501-53060-X.html
- "CJKV Information Processing"
http://www.oreilly.com/catalog/cjkvinfo/
CJK な文字に関しては次のページが参考になると思います。
http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/
http://hp.vector.co.jp/authors/VA001240/article/charcode.html
RFC 関連
http://www.emaillab.org/emailref/emailref.html#i18n
また、UNIX の世界ではこういう文字コード変換ライブラリがあります。
http://clisp.cons.org/~haible/packages-libiconv.html
> > それと、秀丸自体 Unicode (UCS-2)を扱えるのですから、内部処理を
> > Unicode ベースにしてもいいのではないかなと思うのです。
>
> 秀丸エディタの次のバージョン(今β版公開中)では、あくまでシフトJISベー
> スの作りの中でUnicodeも扱えるようにしています。鶴亀メールも最終的には同じ仕
> 組みを使ってUnicode(というか、シフトJISに変換できないUnicode文字)を扱え
> るようにします。
あら、そうなのですか。
Unicode を扱えるから内部処理がそうなのかと思っていました。
--
TAKIZAWA Takashi (滝澤 隆史)
mailto:xxxx@cyber.email.ne.jp
http://www.emaillab.org/
|
|