英文迷惑メールのヒット率No.28609
デンスケ さん 06/09/14 11:05
 
最近秀丸メールを使い始めたのですが、英文の迷惑メールに対する迷惑メールフィル
タのヒット率が、POPFileなどのベイズフィルタと較べて低いような気がします。日
本語については問題無いレベルだと思います。

英文に限れば、ヒット率は7割弱。POPFile, Thunderbirdの場合97%ぐらいでしたから、
秀丸メールの迷惑メールフィルタのヒット率はかなり低いと思います。

ヒットされなかったメールを読むと、随想風の訳の分らない文章で、これといった
キーワードが見付けられないケースが多いように思えます。

何か改善策がありましたら、ご教示願います。

[ ]
RE:28609 英文迷惑メールのヒット率No.28611
秀まるお2 さん 06/09/14 12:45
 
 たしかにおっしゃる通りでして、最近多い、意味不明なくらいぼろぼろに偽装
したメールはほとんどどうにも出来ません。

 やるとしたら、「信頼ワード」に徹底的にワード登録しておきつつ、それに外
れた英文メールは全部迷惑メール扱いするしか無いかなぁと…。ということは、
それなりにユーザーさんの方で出来ます。詳しくは迷惑メールフィルターの設定
を一通り見て欲しいです。

 ベイズ理論のやつで、よくヒット率が90ウンパーセントだとか言いますけど、
極端な話、全部のメールを迷惑メール扱いしてしまえばヒット率100%になり
ますよねぇ。ヒット率が高いことも大事でしょうけど、迷惑じゃないメールを間
違って迷惑メール扱いしてしまう確率がどのくらいあるのか、それが限りなく0
%に近いのなら優秀としか言えませんが…。例えば英文のメールなんて普段全然
やりとりしないよーって人は、調べようが無いような気がします。

[ ]
RE:28611 英文迷惑メールのヒット率No.28613
Panda さん 06/09/14 13:25
 
 Pandaです。
 
ベイズ理論の方のスパムフィルターなのですが、Gyaoからくるメールを
毎回毎回スパムメールですとしてもまた次回受信するときに
非スパムとして処理してしまいます。

迷惑ワードにGyaoを登録してそのあとは問題はないのですが、
なんでスパムメールですと登録したのをベイズ理論の方のスパムフィルター
はスパムとして処理してくれなかったのでしょうか?

閾値の調整をすれば変わってくるのでしょうか?

---

> たしかにおっしゃる通りでして、最近多い、意味不明なくらいぼろぼろに偽装
>したメールはほとんどどうにも出来ません。
>
> やるとしたら、「信頼ワード」に徹底的にワード登録しておきつつ、それに外
>れた英文メールは全部迷惑メール扱いするしか無いかなぁと…。ということは、
>それなりにユーザーさんの方で出来ます。詳しくは迷惑メールフィルターの設定
>を一通り見て欲しいです。
>
> ベイズ理論のやつで、よくヒット率が90ウンパーセントだとか言いますけど、
>極端な話、全部のメールを迷惑メール扱いしてしまえばヒット率100%になり
>ますよねぇ。ヒット率が高いことも大事でしょうけど、迷惑じゃないメールを間
>違って迷惑メール扱いしてしまう確率がどのくらいあるのか、それが限りなく0
>%に近いのなら優秀としか言えませんが…。例えば英文のメールなんて普段全然
>やりとりしないよーって人は、調べようが無いような気がします。

[ ]
RE:28611 英文迷惑メールのヒット率No.28614
デンスケ さん 06/09/14 13:32
 
POPFileを1年間使用してみたのですが、精度は98.74%でした。
迷惑ではないメールを迷惑と判定すれば、この精度は落ちます。
実感として、日本文、英文とも殆んど誤検出が無いという感じです。
Thunderbirdも2週間ぐらいしか使いませんでしたが、結構いけます。
ベイズフィルタは意外と優秀ですよ。無料ですので一度お試し下さい。

個人的に英語メールも必要ですので、英語メールをバッサリ切り捨てることはできま
せん。

[ ]
RE:28613 英文迷惑メールのヒット率No.28615
Iranoan さん 06/09/14 14:04
 
 Panda さん今日は、Iranoan です。
 念の為お断りしておくと、開発者とは何の関わりも無い単なる一ユーザです。
> なんでスパムメールですと登録したのをベイズ理論の方のスパムフィルター
> はスパムとして処理してくれなかったのでしょうか?
 お使いになったフィルタは、カモノハシさんの kbsFilter でしょうか? そ
うであるなら、
http://www14.big.jp/~inami/kamobbs/wforum.cgi?no=127&mode=allread
のスレッドを御覧ください。
 因みにこのスレッドにある。spam/非 spma 判定が変わらなければ、学習を
やり直させるマクロが必要なら公開します。

[ ]