スパム処理の精度向上の工夫に関してNo.32699
hajimett さん 07/11/28 13:01
 
秀丸大変快適に使わせていただいています。
また、
秀丸のスパムフィルタの優秀さをあちこちに言いふらしています。
さて、
そのスパムフィルタのスパムワードに関して。

X-TuruKame-Filter: spam word:"medicine+http:"
が不適切にヒットしてしまうことがあります(False Positive)。
医学系御所属の方の署名にヒットして弾いてしまうのですが、
この辺はどのように工夫するのが最もリーズナブルでしょうか。

何もしなくても、False Positive
(スパムではないのにスパムとして弾いてしまう事例)
が非常に少ないことが秀丸のスパムフィルタを
私の周辺に薦めている理由なのですが、この点で、
私の周辺のユーザに関してはあと一歩というところなのです。

ご教示お願いいたします。

[ ]
RE:32699 スパム処理の精度向上の工夫に関No.32700
秀まるお2 さん 07/11/28 13:33
 
 薬関係の単語は、すみませんが迷惑ワードとして登録せざるを得ないかなぁと
思います。

 もし、薬関係のやりとりを普段されているということであれば、信頼ワードに
そういう単語を登録してもらうしか無いと思います。

 medicine medical drug doctor prescription ...

 この辺全部信頼ワードに登録すればいいんじないかと思います。ただ、そうす
ると薬関係の迷惑メールは全部フィルターにひっかからなくなります。それはど
うしようも無いと思います。

[ ]
RE:32700 スパム処理の精度向上の工夫に関No.32701
hajimett さん 07/11/28 13:49
 
> 薬関係の単語は、すみませんが迷惑ワードとして登録せざるを得ないかなぁと
>思います。

> この辺全部信頼ワードに登録すればいいんじないかと思います。ただ、そうす
>ると薬関係の迷惑メールは全部フィルターにひっかからなくなります。それはど
>うしようも無いと思います。

医学系の内容を含むやりとりでは処置なしということですね。
なにか、正規表現を使った良い方法でもあるのかと
完全な素人的空想で、推測していたのですが・・・

PopFileでは学習さえ済ませればそれなりに行けたのですが
基本的な仕組みが違いますから一長一短。
ユーザのやりとり内容の性質によって得意不得意があるってことですね。

[ ]
RE:32701 スパム処理の精度向上の工夫に関No.32703
Iranoan さん 07/11/28 14:06
 
 hajimett さん今日は、Iranoan です。
 念の為お断りしておくと、開発者とは何の関わりも無い単なる一ユーザです。
> 医学系の内容を含むやりとりでは処置なしということですね。
> なにか、正規表現を使った良い方法でもあるのかと
 単純に、医学系御所属のやり取りをされる方のドメインや所属先を信頼ワー
ドに登録してはどうでしょう? 個人で ISP と契約されている場合は上手くい
かないかもしれませんが、署名には所属先も書いてあるでしょうし。

[ ]
RE:32703 スパム処理の精度向上の工夫に関No.32706
n'Guin さん 07/11/28 20:25
 
hajimett さん、Iranoanさん、こんばんは。
n'Guin です。

> 単純に、医学系御所属のやり取りをされる方のドメインや所属先を信頼ワー
>ドに登録してはどうでしょう?

私の場合は、ac.jp を信頼ワードにいれて、回避していました。
以前は、勤務先のドメインをいれていたのですが、転勤があり、
ac.jp にしています。

もちろん、これは、大学の場合だけなのですが。

[ ]
RE:32706 スパム処理の精度向上の工夫に関No.32719
hajimett さん 07/11/29 23:11
 
Iranoanさん、n'Guinさん コメントありがとうございます

>> 単純に、医学系御所属のやり取りをされる方のドメインや所属先を信頼ワー
>>ドに登録してはどうでしょう?

の「ドメイン」というキーワードで、

>私の場合は、ac.jp を信頼ワードにいれて、回避していました。

の「ac.jp」を連想できないのが素人です(なさけなや)。

なるほど、これなら簡単で、誰にでも勧めやすく、
かつ効果が高そうな方策ですね。

送信者を偽装するSPAMがac.jpの穴をくぐって
どれくらい紛れ込むか(False Negative)
ちょっと運用実験してみて、
あまりFalse Negativeが増えないようなら、
この方策を推奨してみようと思います。

ありがとうございました。

[ ]
RE:32719 スパム処理の精度向上の工夫に関No.32737
hajimett さん 07/12/03 14:58
 
>送信者を偽装するSPAMがac.jpの穴をくぐって
>どれくらい紛れ込むか(False Negative)
>ちょっと運用実験してみて、
>あまりFalse Negativeが増えないようなら、
>この方策を推奨してみようと思います。

ですが、やってみました。
とりあえずの結果ですが、かいくぐるSPAMが増えて
ちょっと好ましくない状態になりました。

原理がよく分からないのですが、
ヘッダの文字列も判断に使っているのでしょうか。
本文にac.jpが見あたらないのに、
X-TuruKame-Filter: safe word:"ac.jp"
と判断されてしまうケースが結構あります。

何かご助言いただけたら幸いです。

[ ]
RE:32737 スパム処理の精度向上の工夫に関No.32738
秀まるお2 さん 07/12/03 15:15
 
 秀丸メール標準の迷惑メールフィルターは、メールのヘッダも本文もすべてを
検索対象としてます。(X-Attach:とか一部例外はありますが)

 メールをエディタで開いてヘッダを「すべて表示」にして検索してみれば、ど
こかにヒットしてると思います。

[ ]
RE:32738 スパム処理の精度向上の工夫に関No.32739
hajimett さん 07/12/03 15:52
 
> 秀丸メール標準の迷惑メールフィルターは、メールのヘッダも本文もすべてを
>検索対象としてます。(X-Attach:とか一部例外はありますが)
了解です。
ヘッダにはあることは認識しておりました。
ドメイン(の一部)をSafeWordにすると、
From:だけじゃなく、いろんなところでヒットしちゃっうんですね。

[ ]
RE:32739 スパム処理の精度向上の工夫に関No.32740
n'Guin さん 07/12/03 16:50
 
hajimett さん、こんばんは。

説明が足りなくてすみません。
>ドメイン(の一部)をSafeWordにすると、
>From:だけじゃなく、いろんなところでヒットしちゃっうんですね。
はい。


"X-TuruKame-Filter:" が "spam" で始まる かつ
"From:" が "ac.jp" を含まない
 → "迷惑メール"に移動する
というように振り分けさせています。

説明が不十分で申し訳ありませんでした。

[ ]
RE:32740 スパム処理の精度向上の工夫に関No.32752
hajimett さん 07/12/04 10:49
 
>"X-TuruKame-Filter:" が "spam" で始まる かつ
>"From:" が "ac.jp" を含まない
> → "迷惑メール"に移動する
>というように振り分けさせています。

再度この方法でトライしてみます。
ご丁寧にありがとうございます>各位

[ ]