spam (including non-japanese kanji)No.12593
ka-chan さん 06/06/05 16:29
 
いつもお世話になります。

外国語メールの扱い→日本語と英語以外の外国語メールを迷惑メール扱いとする
がオンだとspam (including non-japanese kanji)と表示されるメールがあります。
まあ。信頼できる差出人に登録してしまえば解決するわけですが・・・

よく見るとヘッダのThread-Topic:の部分が文字化けしています。
これが原因でしょうか?

そのまま開く:
Thread-Topic: =?iso-2022-jp?B?VGVjaE5ldCBGbGFzaCBKYXBhbiAtIBskQkJnOSVJPiFWGy
hCSVQgUA==?=
 =?iso-2022-jp?B?cm8gGyRCRjs+bCFXJCwhIjxzRVQ3dz1kNkgkcjMrO08bKEIhICg=?=
 =?iso-2022-jp?B?MjAwNi82LzEgVm9sLiAxOTQp?=

デコードして開く:
Thread-Topic: TechNet Flash Japan - ?卄?]?uIT Pro ???ꁶ???
A??????Ƃ?n! (2006/6/1 Vol. 194)

ご確認の程よろしくお願いします。

[ ]
RE:12593 spam (including non-japanese kNo.12594
秀まるお さん 06/06/05 17:42
 
 そのThread-Topic:ヘッダ入りの適当な日本語メールを生成してテストしてみ
た限りでは、特にspamと判定されることは無くて、普通にunclearとなってしま
いました。

 そのヘッダとは別の所に問題があるんじゃないかと思います。

 一応、そのTechNetってやつの購読を今申し込んでみましたけど、HTML形式と
テキスト形式の2通りあるみたいでして…。テキスト形式にしてみましたが。

 出来ればそのメールの受信ログ全体を僕に添付ファイルで送って欲しいです。
それでテストしてたしかにspamと判定されれば原因が特定できると思います。

 送り先は、 maruo@mitene.or.jp です。

[ ]
RE:12594 spam (including non-japanese kNo.12595
ka-chan さん 06/06/05 18:21
 
spam (including non-japanese kanji)と判定され
Thread-Topic:の部分が文字化けしているのはHTML形式でした。
TXT形式のメールでは確かに文字化けしません。

該当メールを転送しましたので、ご確認の程よろしくお願いします。

[ ]
RE:12595 spam (including non-japanese kNo.12596
秀まるお さん 06/06/06 08:39
 
 問題のメール送っていただきありがとうございます。調べてみたら、たしかに
Thread-Topic:の内容が化けてました。

 utf-8文字コードとjis文字コード混在になっている所の変換関係の所がバグっ
ているみたいです。ということでさっそく修正させていただきます。

 ただし、僕の所では、標準の迷惑ワードにどっちにしてもひっかかってしまう
ようではあります。こういった広告的な内容のメールはどうしても迷惑メール扱
いになってしまうので、どっちにしても「信頼できる差出人」に登録するなり、
信頼ワードとして「TechNet」を登録するなりしていただかないとダメそうです。

[ ]
RE:12596 spam (including non-japanese kNo.12597
秀まるお さん 06/06/06 09:24
 
 っと直そうと思ったら、やっぱり直せませんでした。

 Thread-Topic:ヘッダの内容は、=?utf-8?.... ってことでutf-8文字コードだ
と指定されてますが、実際にデコードしてみるとshift-jis文字コードの内容が
出てきてしまうようでして、それをutf-8と見なして処理すると化けてしまいま
す。

 文字コード指定が無い場合に自動判定するってことなら別として、はっきり
utf-8と指定しているのに実際の中身は別だとかっていうのはどうしようも無い
です。ということで、メールが化けてしまうのは仕方がないとさせていただきま
す。

 あと、こういうメールが「including non-japanese kanji」と判定されるのは、
これはこれで、中国人が発信してると思わしきたどたどしい日本語迷惑メールを
判定するのに役立っていると思うので、これも、こういう例外ケースのために外
すのはよくないと思います。(どっちにしても広告的な内容は迷惑メール扱いに
なることだし)

 ということでお願いします。

[ ]
RE:12596 spam (including non-japanese kNo.12598
ka-chan さん 06/06/06 10:05
 
一度、迷惑ワードが空の状態でspam (including non-japanese kanji)と
判定されることをご確認いただけると嬉しく思います。
また同じ原因とは思いますが、添付ファイルとして転送を選ぶとSubject:
が文字化けするようです。

お手数をおかけしますがよろしくお願いします。

[ ]
RE:12598 spam (including non-japanese kNo.12599
秀まるお さん 06/06/06 10:12
 
 というか、改めてテストしてみたんですけど、送っていたたいた「.eml」形式
ファイルは、本来の受信ログそのままではなさそうです。

 お手数ですが、以下の手順でもう一回受信ログを送って欲しいです。

 1.問題のメールを選択する。
 2.「ファイル・エクスポート...」を実行して、
 3.「現在のメールに対応する受信ログ/送信ログをエクスポートする」
   をONにして実行する。
 4.出力されたファイルを出来れば.lzh形式などに圧縮する。
   (一応、文字コード変換させない用に念のため)
 5.それを添付ファイルで送る。

[ ]
RE:12597 spam (including non-japanese kNo.12600
ka-chan さん 06/06/06 10:15
 
別に粘着するつもりはありませんが
Subject:とThread-Topic:に違いは無いように見えますし
utf-8が指定されてるというのもいまいち理解できません。

[ ]
RE:12599 spam (including non-japanese kNo.12601
ka-chan さん 06/06/06 10:32
 
問題のメールをエクスポート、圧縮して送付しました。
お手数をおかけしますが、再度ご確認の程よろしくお願い致します。

[ ]
RE:12601 spam (including non-japanese kNo.12602
秀まるお さん 06/06/06 11:44
 
 お手数かけます。今度はちゃんと再現できました。たしかにThread-Topic:ヘ
ッダの中身が化けていました。

 ということでそれはそれで修正できました。

 ただし、どっちにしても標準の迷惑ワード(…お会い+プロフ+連絡…、など複
数)にひっかかってしまって迷惑メールと判定されてしまいますが、それは仕方
がないということでお願いします。

[ ]
RE:12602 spam (including non-japanese kNo.12605
ka-chan さん 06/06/08 16:12
 
V4.65β7

Thread-Topic:ヘッダが正常に表示され、spam (including non-japanese kanji)と
誤判定されることもなくなりましたが

このメールを選択して、添付ファイルとして転送を選ぶとSubject:が文字化けする
のは変わっていません。
まあ。通常このメールにその様な操作をすることは無いと言えば無いと思います
が・・・

[ ]
RE:12605 spam (including non-japanese kNo.12606
秀まるお さん 06/06/08 16:29
 
 すみません。添付ファイルとして転送がおかしかった話は全然認識できてませ
んでした。また直します。

[ ]
RE:12606 spam (including non-japanese kNo.12630
ka-chan さん 06/06/13 16:25
 
 V4.65β8 にて正常に動作することを確認しました。
ありがとうございました。

[ ]