[bug?] inport において文字の誤認識No.00872
ひろ さん 00/10/29 22:16
 
 秀まるお様今日は、ひろです。
 bug といってしまうには酷なのですが、他の MUA からの inport におい
て文字 code の誤認識がやはり起きてしまうようです。問題の起きる mail
は Shift-JIS で保存されているのですが、mail を見てみると Shift-JIS の
file を EUC として開いたときの表示になります。

 繰文字 code の完全な自動認識は難しいので、り返しになりますが、やは
り文字 code は変換せしない方がよいのではないでしょうか?

 P.S 再現する mail は幾つかありますが、その中で半角カナが含まれてい
ないものは、残念ながらある ML の人のお送りできる様な物がありません。

[ ]
RE:00872 [bug?] inport において文字の誤認識No.00906
秀まるお さん 00/10/31 11:31
 
> は Shift-JIS で保存されているのですが、mail を見てみると Shift-JIS の
> file を EUC として開いたときの表示になります。

 Shift-JISのはずがEUCとなってしまうのは、たぶん文字コードの指定が無いと
認識されているからだと思います。

 Version 0.39からは、charset=XXXXと何か指定してあれば、少なくともEUC->
ShiftJISの変換はしないはずです。

>  繰文字 code の完全な自動認識は難しいので、り返しになりますが、やは
> り文字 code は変換せしない方がよいのではないでしょうか?

 JISをShift-JISに変換することで、何か他の言語の文字コードを化けさせてし
まうことはありえないと思います。問題なのは、文字コードが不明の時に、EUC
->ShiftJISの自動認識が常に働いてしまうことだと思います。

 ってことで、とりあえずはEUC->ShiftJISの自動変換について、変換ロジック
またはオプション類の追加など考えてみます。

[ ]
RE:00906 [bug?] inport において文字のNo.00924
ひろ さん 00/10/31 12:24
 
 秀まるお様今日は、ひろです。
>  Shift-JISのはずがEUCとなってしまうのは、たぶん文字コードの指定が無いと
> 認識されているからだと思います。
>
>  Version 0.39からは、charset=XXXXと何か指定してあれば、少なくともEUC->
> ShiftJISの変換はしないはずです。
 Winbiff の古い type の mail folder のため、
> Content-Type: text/plain; charset=ISO-2022-JP
の指定はあるのですが、実際は Shift-JIS で保存されており、半角カタカ
ナが無い mail でも起きます。

>  ってことで、とりあえずはEUC->ShiftJISの自動変換について、変換ロジック
> またはオプション類の追加など考えてみます。
 これで直ればよいのですが...。

 P.S お忙しくて、どれを読んだか把握することが難しいと思いますが、876
へのレスをお願いします。

[ ]
RE:00924 [bug?] inport において文字のNo.00938
秀まるお さん 00/10/31 17:54
 
> > Content-Type: text/plain; charset=ISO-2022-JP
> の指定はあるのですが、実際は Shift-JIS で保存されており、半角カタカ
> ナが無い mail でも起きます。

 charsetの指定があるなら変換しないはずだったんですけど、んではもう一度
調べてみます。

[ ]
RE:00924 質問 to ひろさんNo.00941
秀まるお さん 00/10/31 18:18
 
 ひろさんすみません。確認ですが、文字化けしたのはメール本文ではなくて、
ヘッダの中のどこかってことでしょうか?

 ヘッダ部分についてはEUCかどうかの自動判定が働いてしまう場合があるよう
ですけど。

[ ]
RE:00941 質問 to ひろさんNo.00943
ひろ さん 00/10/31 19:11
 
 秀まるおさん今日は、ひろです。
>  ひろさんすみません。確認ですが、文字化けしたのはメール本文ではなくて、
> ヘッダの中のどこかってことでしょうか?
 header については MIME encode されたままなので問題ありません。本文
だけです。

[ ]
RE:00943 質問 to ひろさんNo.00951
秀まるお さん 00/10/31 22:49
 
>  header については MIME encode されたままなので問題ありません。本文
> だけです。

 本文について化けるなら、EUC関係の処理とは無関係かもしれないですが、も
しEUC->ShiftJIS自動変換されているのだとしたら、たぶん次のバージョンで直
ると思います。

 次のバージョンではEUCかどうかの判定をもっと厳しくしまして、半角カナ相
当文字が入っていたとしても、ShiftJISへ変換後のコードに矛盾がある場合
(ShiftJISとして正しくない文字が発生してしまう場合)には変換しないように
しました。

[ ]
RE:00951 質問 to ひろさんNo.00964
ひろ さん 00/11/01 11:29
 
 秀まるお様今日は、ひろです。
> しEUC->ShiftJIS自動変換されているのだとしたら、たぶん次のバージョンで直
 次版で再度発生するようなら、改めて御連絡します。

[ ]