文字化け charset=gb2312 (maybe)No.21933
hyoshitomo さん 05/03/03 15:56
 
何時も大変便利に鶴亀メールを使わせていただいております。

ある特定の人からの日本語メールが文字化け(漢字ばかりの羅列)することがありま
す。

文字化けしたメールのヘッダ
X-Priority: 3
X-MSMail-Priority: Normal
X-Mailer: Microsoft Outlook Express 6.00.2900.2180
X-RFC2646: Format=Flowed; Original
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.2180
X-Body-Content-Type: ; charset=gb2312 (maybe)

文字化けしないメールのヘッダ
MIME-Version: 1.0
Content-Type: text/plain;
 charset="iso-2022-jp"
Content-Transfer-Encoding: 7bit
X-Priority: 3
X-MSMail-Priority: Normal
X-Mailer: Microsoft Outlook Express 6.00.2800.1478
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2800.1478

ためしに、文字化けしたメールの "; charset=gb2312 (maybe)" 部分を削除して保存
すると、きちんと見える様になりました。

私の環境は、下記の通りです。
WindowsXP-Pro SP1 + WindowsUpdate
IE 6.0
鶴亀メール Version 4.09

私の設定が悪いのか、相手の設定が悪いのか、どうすれば解決するのが教えていただ
きたく、書き込みをしました。

よろしくお願い致します。

[ ]
RE:21933 文字化け charset=gb2312 (maybeNo.21935
秀まるお2 さん 05/03/03 17:47
 
 とりあえず、「全般的な設定・上級者向け」の「上級者向け設定を表示する」
をONにした上で、「全般的な設定・上級者向け・デコード」の、上から2番目に
ある「文字コードが不定なメールはなるべく日本語扱いとする」をONにすれば、
たぶん日本語と解釈されるようになると思います。

 あと、仮に文字化けした場合には、そのメールをダブルクリックするなどして
エディタで開いて、そこで「設定・文字コード・日本語」とすることで、正しく
日本語で表示されなおすと思います。

------------------------
 今ちょっとgoogleにて、その「X-RFC2646: Format=Flowed; Original」のよう
なヘッダを含むメールがいったいどういう物か調べてみたんですけど、英語のサ
ンプルは出てきたものの、日本語の物はいまいち見つかりませんでした。ただ、
そういうメールには文字コードの指定が入ってないことは確かなようでして、そ
ういう場合は鶴亀メールが文字コードの自動判定をするんだと思います。

 出来れば具体的に文字化けするメールのサンプルをいただけたら助かりますが
…。僕に送っても問題ないメールがあれば、そのメールを選択して、

 「ファイル・エクスポート...」を実行して、形式=1メール1ファイル形式、
「現在メールに対応する受信ログ/送信ログをエクスポートする」をON

 でエクスポートして、生成されたファイルを、いわゆる添付ファイルの形で僕
に送って欲しいです。送り先は、 maruo@mitene.or.jp です。

 もしそういう形で僕に送っていただくことが出来ないにしても、僕の方で追加
でいろいろ調査/テストなどしてみます。

[ ]
RE:21933 文字化け charset=gb2312 (maybeNo.21938
おひ さん 05/03/03 19:19
 
外している可能性は大なのですが可能性の一つとして…,

本文20文字程度の日本語メールだと化けない,ってことはないでしょうか?
(6.00.2900.2180 側から送信)

[ ]
RE:21938 文字化け charset=gb2312 (maybeNo.21941
おひ さん 05/03/03 21:57
 
多分,外してる可能性が高いです.
私が予想したケースが,他のメールソフトから送られてきましたが,
鶴亀側では問題ありませんでした.

ご参考までに,OE (V6.00.2900.2180) から受信したメールで,
X-RFC2646: がついているメールはまだ届いていませんでした.
ヘッダ関係も普通でした.
#RFC2646準拠はわかるけど,どういう場合に付加するのだろう….

[ ]
RE:21935 文字化け charset=gb2312 (maybeNo.21943
秀まるお2 さん 05/03/03 22:24
 
 自動判定になってるという前提だとしたらですけど、内部的な判定を見た所、
ひらがながや全角英数字(ShiftJISコードの1バイト目が0x82以下の文字)が、
その他の全角文字の1/4以上あれば日本語と判定されるようです。

 日本語のメールであっても、ひらがなが極端に少ないとダメみたいです。例え
ばカタカナだらけだったり漢字ばっかりだったりするとダメみたいですが…。

 どういう文字が多いメールか程度でも教えていただけると、それで、その辺の
判定ロジックが修正できそうな気がします。例えば全角カタカナがそれなりに多
く入っているなら、そういうメールも日本語と判定するようにしようかなぁと思
ったりしますけど。

[ ]
RE:21941 文字化け charset=gb2312 (maybeNo.21944
秀まるお2 さん 05/03/03 23:10
 
> X-RFC2646: がついているメールはまだ届いていませんでした.

 メールじゃなくて、ニュースグループへの投稿みたいな気がします。

[ ]
RE:21944 文字化け charset=gb2312 (maybeNo.21945
おひ さん 05/03/04 01:55
 
以下,ご参考まで.

>  メールじゃなくて、ニュースグループへの投稿みたいな気がします。

OE が手元で動かないので未確認ですが(SP2でもないし),

ニュースグループでの話です.
ニュースグループだと付く,と言う話ではないみたいです.
実際,6.00.2900.2180 でも X-RFC2646: が付いているのはほとんど
無く,メール同様 OE の一般的な下記の感じでした.

----------------------------抜粋----------------------------
MIME-Version: 1.0
Content-Type: text/plain;
        format=flowed;
        charset="ISO-2022-JP";
        reply-type=original
Content-Transfer-Encoding: 7bit
X-Priority: 3
X-MSMail-Priority: Normal
X-Newsreader: Microsoft Outlook Express 6.00.2900.2180
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.2180
------------------------------------------------------------

X-RFC2646: 付きは海外からの1件だけ残っていましたが(本文ASCI
のみ),hyoshitomo さん記載の感じでした.


既にご覧になっているかと思いますが.
 http://support.microsoft.com/default.aspx?scid=kb;JA;883806
なので,メールにも当てはまると思います.


#ASCIIオンリーでも,charset="ISO-2022-JP" 決めうちで送ってくる
  OE が,X-RFC2646: だとこの辺のヘッダがないのはなぜだろう….

[ ]
RE:21935 文字化け charset=gb2312 (maybeNo.21962
hyoshitomo さん 05/03/04 16:17
 
連絡が遅くなりました。

> とりあえず、「全般的な設定・上級者向け」の「上級者向け設定を表示する」
>をONにした上で、「全般的な設定・上級者向け・デコード」の、上から2番目に
>ある「文字コードが不定なメールはなるべく日本語扱いとする」をONにすれば、
>たぶん日本語と解釈されるようになると思います。

上記設定を入れると、日本語で表示されました。
X-Body-Content-Type:が  "; charset=iso-2022-jp (maybe)"  に変わっていました。

> あと、仮に文字化けした場合には、そのメールをダブルクリックするなどして
>エディタで開いて、そこで「設定・文字コード・日本語」とすることで、正しく
>日本語で表示されなおすと思います。

こちらの操作でも、日本語で表示されました。

> 出来れば具体的に文字化けするメールのサンプルをいただけたら助かりますが

仕事上でのメールなので、送ることが出来ません。
ご協力できなくて残念です。

[ ]
RE:21943 文字化け charset=gb2312 (maybeNo.21963
hyoshitomo さん 05/03/04 16:24
 
> 自動判定になってるという前提だとしたらですけど、内部的な判定を見た所、
>ひらがながや全角英数字(ShiftJISコードの1バイト目が0x82以下の文字)が、
>その他の全角文字の1/4以上あれば日本語と判定されるようです。

技術文章なので、漢字と全角カタカナが結構あり、ひらがなは少ないです。
ということは、上記のロジックで日本語意外と判定されている気がします。

[ ]
RE:21963 文字化け charset=gb2312 (maybeNo.21965
秀まるお2 さん 05/03/04 17:36
 
 一応、ひらがなが少なくてもカタカナがそこそこあれば日本語と自動判定する
ように直します。(V4.10から)

 どっちにしても「全般的な設定・上級者向け・デコード」の「なるべく日本語
扱いとする」オプションをONにすることで、今後は問題無くなると思います。そ
れでお願いします。

[ ]