[質問]迷惑ワード 単語とドメインの優先順No.08778
まっちん さん 04/12/09 16:58
 
 こんにちは。迷惑メールフィルタ機能について質問があります。

・迷惑ワード(単語)と迷惑ドメインではどちらが優先されるのでしょうか?
 (試してみると単語が先に調べられるようですが、仕様上は?)

・迷惑ワードの方にドメイン名を登録すると、動作に支障があるのでしょうか?


質問の動機:
 迷惑ドメインの方を先に調べてもらった方が誤認が減りそう。広告配信専門、
しつこい差出人、既知のドメインには効果的。
 他方、単語の方が広範な差出人をカバーできそう。

 この辺りを調整できるかどうか、質問したかったわけです。
 (要望ではないです。)

[ ]
RE:08778 [質問]迷惑ワード 単語とドメイNo.08779
秀まるお さん 04/12/09 17:25
 
 迷惑ワードが2つ分かれて見えますが、内部的には統一的に扱われてます。

 単語1つ1つについての優先順位は無くて、単に、メールの先頭から検索して
いって最初にマッチした迷惑ワードが「spam word:...」に出てくるだけです。

>  迷惑ドメインの方を先に調べてもらった方が誤認が減りそう。広告配信専門、
> しつこい差出人、既知のドメインには効果的。
>  他方、単語の方が広範な差出人をカバーできそう。

 ドメイン名を登録するほうが、迷惑ワード登録の手間は楽だと思います。そう
じゃなくて、メールの中の単語を迷惑ワードに登録しようとすると、果たしてそ
れが普通のメールに間違ってヒットしないかどうか考えないといけないので、か
なり大変だと思います。

 僕はDefaultSpamWord.txtを提供する関係でそういう面倒なことをいつも考え
てますが、最近はあまりいい単語を追加できないでいます。本文が非常に短い場
合とか、何が言いたいのか意味不明なのとかはワードの拾いようが無いです。

------------
 最近思うんですけど、せっかく迷惑メールフィルターを作っても、迷惑ワード
を考えるのに大変手間がかかってしまい、本末転倒になってる人が多いんじゃな
いかって気がします。なんちゅうか、迷惑メール分類マニアみたいな方向にみん
ななってしまってて、なにがなんでも迷惑メールを「spam」と判定させたくなっ
てしまうというか…。

 迷惑メールといってもいろいろあるし、線引きも難しいので、だいたい標準の
迷惑ワードにひっかからなかったらもうそれであきらめても仕方がないかと思う
んですよねぇ。

 なので、「迷惑ワードは一般ユーザー様はいじらない方がいいです」みたいな
断り書きを入れるとか、あるいは「迷惑ワードをカスタマイズする」みたいなオ
プションを用意して、標準ではそれをOFFにしておいて、一般ユーザー様が迷惑
ワードを気にすることが無いようにしたらいいかなぁと思ったりすらします。

[ ]
RE:08779 [質問]迷惑ワード 単語とドメイNo.08780
まっちん さん 04/12/09 18:36
 
こんばんは。

> 迷惑ワードが2つ分かれて見えますが、内部的には統一的に扱われてます。
>
> 単語1つ1つについての優先順位は無くて、単に、メールの先頭から検索して
>いって最初にマッチした迷惑ワードが「spam word:...」に出てくるだけです。

ということは、単純にリストが連結されているだけなのですね。参考にします。


>>  迷惑ドメインの方を先に調べてもらった方が誤認が減りそう。広告配信専門、
>> しつこい差出人、既知のドメインには効果的。
>>  他方、単語の方が広範な差出人をカバーできそう。
>
> ドメイン名を登録するほうが、迷惑ワード登録の手間は楽だと思います。そう
>じゃなくて、メールの中の単語を迷惑ワードに登録しようとすると、果たしてそ
>れが普通のメールに間違ってヒットしないかどうか考えないといけないので、か
>なり大変だと思います。
>
> 僕はDefaultSpamWord.txtを提供する関係でそういう面倒なことをいつも考え
>てますが、最近はあまりいい単語を追加できないでいます。本文が非常に短い場
>合とか、何が言いたいのか意味不明なのとかはワードの拾いようが無いです。

同感です。迷惑ドメインなしで、標準というのはさらに大変そうですが。


>------------
> 最近思うんですけど、せっかく迷惑メールフィルターを作っても、迷惑ワード
>を考えるのに大変手間がかかってしまい、本末転倒になってる人が多いんじゃな
>いかって気がします。なんちゅうか、迷惑メール分類マニアみたいな方向にみん
>ななってしまってて、なにがなんでも迷惑メールを「spam」と判定させたくなっ
>てしまうというか…。
>
> 迷惑メールといってもいろいろあるし、線引きも難しいので、だいたい標準の
>迷惑ワードにひっかからなかったらもうそれであきらめても仕方がないかと思う
>んですよねぇ。

 振り分け機能が強力なので、フィルター機能で特に助かっているのはHTML関係
とtrick word判定だったりします。


 最近は経路ヘッダまで偽造していると思われるメールまであります。
(ソフトウェアのバグらしく、変数展開に失敗したメールが届きまして。
 実在のドメイン名で各種ヘッダを生成する賢さでしたが。)

市販の対策ソフトは経路までみているのでしょうかねぇ。

[ ]