文字コード判別No.16334
たけのこ さん 04/01/23 10:30
 
一般ユーザのたけのこです。

Content-Typeがこんなメールが届きました。
    Content-Type: text/plain; charset=gb2312 (original=ISO-2022-JP)
で、実際にはISO-2022-JPのようなのですが(ログを「そのまま開く」したもの
を、名前を付けて保存して、秀丸で開くとJISとして認識して読める)、なぜ中
国語になってしまったのか不思議です。

で、これだけではたぶん理由など判別しようがないでしょうから、当該メールを
miteneのアドレスに送らせていただきました。

(^^)/”

[ ]
RE:16334 文字コード判別No.16339
秀まるお2 さん 04/01/23 19:24
 
 これはたしかにまずいんですけど、一応、現状の鶴亀メールの動作が明らかに
間違ってるとも言えない所があります。

 このメールの中には、「iso-8859-4」という文字コード指定の文字列が一部含
まれてまして、結果、このメールはいわゆる多国語混在メール扱いとなってしま
います。しかし、その後、この中の文字を全部中国語に変換すると、それがちゃ
んと通ってしまいます。

 中国語の文字コードの中にも、一応、日本語のひらがなが含まれているようで、
普通の日本語文章が中国語としても表現できてしまうようです。実際、画面上で
内容を読むことが出来てしまいます。

 ということではありますが、こういう場合(日本語ひらがなが含まれる場合)
は中国語と判定せずに、多国語混在メール扱いにするよう修正させていただきま
す。

[ ]
RE:16339 文字コード判別No.16374
たけのこ さん 04/01/26 10:46
 
一般ユーザのたけのこです。

// 金曜日は定時ダッシュで、土日はネット環境のないトコへ出かけてました。

>  このメールの中には、「iso-8859-4」という文字コード指定の文字列が一部含
> まれてまして、結果、このメールはいわゆる多国語混在メール扱いとなってしま
> います。しかし、その後、この中の文字を全部中国語に変換すると、それがちゃ
> んと通ってしまいます。

ほほう!と思ってくだんのログを見てみると、User-Agentのトコに確かにiso-
8859-4がありますね。

>  中国語の文字コードの中にも、一応、日本語のひらがなが含まれているようで、
> 普通の日本語文章が中国語としても表現できてしまうようです。実際、画面上で
> 内容を読むことが出来てしまいます。

そうなんですよね。読めるんですけど、なんだかフォントが違う……と思って
Charsetを見てみたら中国語になっていた……というのが、今回の始まりなんで
すけど。

>  ということではありますが、こういう場合(日本語ひらがなが含まれる場合)
> は中国語と判定せずに、多国語混在メール扱いにするよう修正させていただきま
> す。

実際、多国語混在なんで、それが良さげですね。

(^^)/”

[ ]