X-Body-Content-Type 不具合No.12884
adachi さん 03/05/20 13:20
 
adachi です。


ずいぶん前からのことのようですが、X-Body-Content-Type:について、不具合が有る
ようです。
charsetがわからないと、鶴亀がX-Body-Content-Typeを追記する仕様だと思うのです
が、なぜだか、日本語を中国語(gb2312)と間違えて判断してしまうというものです。

X-Body-Content-Type: ; charset=gb2312 (maybe)




どうやら、古い話ですが 2003/7/26 に鶴亀のバージョンアップをしたあたりでおか
しくなっていると思われます。
それまでは、
X-Body-Content-Type: ; charset=euc-jp (maybe)
と書き込んでいました。

肝心のこのメールですが、TurboLinux7の namazuのindex作成のログを、cron.dで送
ってきているものです。
ずっとこのメールをチェックしていなかったので、このことに今まで気づきませんで
した。前述の日付以後のメールは、すべてgb2312となっています。


必要でしたら、メールを別途添付して送ることもできます。


----
X-Body-Content-Type についての記述が見つけられず、もしかして鶴亀起因では無い
かもしれません。その場合はご容赦を...。
全般的な設定-ヘッダ-不要ヘッダ で 指定しても削除できないので、この処理のあと
鶴亀が挿入しているのでは、と考えました。


よろしくお願いします。

[ ]
RE:12884 X-Body-Content-Type 不具合No.12891
秀まるお2 さん 03/05/20 16:37
 
 Content-Type:ヘッダに文字コードの指定が無いメールでの話かと思います。
その場合はたしかに鶴亀メール側で文字コードを自動判定しまして、日本語EUC
か、あるいは中国語なのか韓国語なのか等調べます。

 手元で文字コード指定なしの本文がeuc文字コードのメールを作成し、イン
ポートしてみましたが、こちらでは正しくeucと認識されました。

 たぶんそのメール内容が分からないと調べられないので、差し支えなければそ
のメールのサンプルをください。

 「関連するメールを開く・このメールのログ」で出てくる内容をそっくりその
まま「ファイル・名前を付けて保存...」で保存して、それをlzh形式に圧縮して
送って欲しいです。でないとEUC文字コードがShiftJISに変換されてしまう恐れ
があります。

 送り先は、 maruo@mitene.or.jp です。

[ ]
RE:12891 X-Body-Content-Type 不具合No.12922
秀まるお2 さん 03/05/21 17:10
 
 メール頂きましたが、ここにコメントします。

 送って頂いたメールには(連絡いただいた通り)EUC文字コードとして不正な
文字が少々ありました。

 EUCとして不正な文字が1つでもあると、その後の判定で大抵の場合中国語と
して通ってしまうようです。それはそれでよろしくないので、

 「EUCとして不正な文字が、2バイト文字全体の2%以下である、かつ、ヘッダ部
分に日本から発信されたと思わしき情報が含まれている」

 の場合はEUCと解釈することにします。

 日本から発信されたら思わしきかどうかの判定には、

 − From:が「.co.jp」を含む。または、
 − Date:が「 +0900」を含む。または、
 − Message-Id:が「.co.jp」を含む。

 とします。

[ ]