迷惑メール判定についてNo.35231
花音 さん 08/12/24 13:31
 
迷惑メールフィルタを使ってます。
発信国フィルタも使って、「西ヨーロッパ諸国」「その他」、個別で
台湾以外からのメールは迷惑メールとするようにしています。

いくつか質問なのですが、

@発信国が南アフリカと判定されたメールが、迷惑メールと判定
されずに、
X-TuruKame-Filter: unclear
となっていました。これは何故でしょうか?

A発信国というのは、どうやって調べるのでしょうか?
迷惑メールと判定されたメールの中には、日本ドメインのメルアドから
日本ドメインのメルアドに宛てたメールが、発信国=中国と判定された
物もあります。

➂上の質問とも絡みますが、日本ドメインから日本ドメインに宛てた
メールでも、正常な(迷惑でない)メールは発信国=日本となっている
ことが殆どで、迷惑メールは発信国が中国や韓国等になっていることが
多いです。これは、迷惑メールは特殊な送信方法をしているということ
でしょうか?

➃迷惑メールと判定されたメールの中に、その理由として
X-TuruKame-Filter: spam (euro charset)
となっている物がありました。これはどういう意味でしょうか?
中身は英語のメールでした。
内容は迷惑メールのような気もするけどグレーといった感じです。

D海外の人から個人的なメールを受け取ることは皆無ですけど、
マイクロソフトやボーランドなどから無償で提供されてるソフト
(Visual Studio 等)をダウンロードして、案内のメールも
受け取りたいと思ってます。
この場合の設定は、冒頭に書いたような、「西ヨーロッパ諸国」
「その他」、台湾だけ許可する設定で妥当でしょうか?


よろしくお願いします。

[ ]
RE:35231 迷惑メール判定についてNo.35232
秀まるお2 さん 08/12/24 14:19
 
>@発信国が南アフリカと判定されたメールが、迷惑メールと判定
>されずに、
>X-TuruKame-Filter: unclear
>となっていました。これは何故でしょうか?

 発信国フィルターで、「アフリカ大陸の国全般」がONになっていれば、うまく
迷惑メール判定してくれるはずだと思います。

 こちらで試した限りは、うまく判定してくれましたけど。

X-TuruKame-Filter: spam (SenderCountry=ZA)

 みたいになりました。

 発信国フィルターは、メールが外国語メールであることが前提なので、もしか
してメールが日本語だとうまく判定しませんけど。そういう可能性が1つ考えら
れるかなぁと思います。

>A発信国というのは、どうやって調べるのでしょうか?
>迷惑メールと判定されたメールの中には、日本ドメインのメルアドから
>日本ドメインのメルアドに宛てたメールが、発信国=中国と判定された
>物もあります。

 メールの中のReceived:ヘッダの中身から判定しています。Received:ヘッダの
中に入っているIPアドレスから、「どのIPアドレスがどの国に割り当てられてい
るか」というデータベースを使って、それで判定しています。

 From:ヘッダの内容は、迷惑メールの場合だとデタラメに偽装されてるので、
それはまったく当てにならないです。

>日本ドメインから日本ドメインに宛てた
>メールでも、正常な(迷惑でない)メールは発信国=日本となっている>多いです。
>これは、迷惑メールは特殊な送信方法をしているということ
>でしょうか?

 憶測になりますが…、迷惑メールは、迷惑メールを発信しても文句を言われる
ことが無いような国から発信されていることが多いです。

 たとえば日本の誰かがその人のパソコンから迷惑メールを発信したとします。
そうすると、迷惑メールをその人が発信しているってことが、先ほどの
Received:ヘッダからバレてしまいます。

 日本には迷惑メールを発信する人を罰則する法律があるので、そういうことを
したらその人は逮捕されたりすると思います。なので、日本から迷惑メールが発
信されることは、あまり無いのだと思います。

 もう1つの発信源として、いわゆる「ボットネット」があると思います。こち
らについても、最近の日本のプロバイダーでOutbound Port 25 blocking対策が
なされてる関係で、かなり抑制されてるのではないかと思います。(ボットネッ
トについてはgoogle検索などすると出てきます)

>X-TuruKame-Filter: spam (euro charset)
>となっている物がありました。これはどういう意味でしょうか?
>中身は英語のメールでした。

 「spam (euro charset)」は、「日本語と英語以外の外国語メールを迷惑メー
ル扱いとする」がONの場合に、何らかの欧文文字がある程度以上入っているケー
スに相当します。

 英語のようであっても、たぶん欧文文字が何文字か入っていると思います。欧
文文字というのは、たとえば「A」の上に点々がついてるやつとかの、ドイツ語
やフランス語等の言語で使う文字です。

>D海外の人から個人的なメールを受け取ることは皆無ですけど、
>マイクロソフトやボーランドなどから無償で提供されてるソフト
>(Visual Studio 等)をダウンロードして、案内のメールも
>受け取りたいと思ってます。

 信頼ワードを適当に登録するのがおすすめです。

 ボーランドからのメールについては、単純に「borland」で登録すればいいと
思います。

 microsoftからのメールについては、「microsoft」で登録したのでは多数の迷
惑メールに誤判定が発生してしまうので、これについては何か適当な信頼ワード
を考えて登録しないとダメかと思います。実際に配信されて届いたメールがある
ならば、その中から信頼ワードを決めるのが一番いいと思います。

 秀丸メールの迷惑メールフィルター、基本的に広告的な意味のメールはすべて
迷惑メール判定してしまいます。なので、意図的に受信したい広告的メールにつ
いては、信頼ワードの登録が欠かせないです。

>この場合の設定は、冒頭に書いたような、「西ヨーロッパ諸国」
>「その他」、台湾だけ許可する設定で妥当でしょうか?

 外国語の迷惑メールがとにかく多くて困るということであれば、そういう設定
は妥当な所かと思います。というか、別に台湾も迷惑扱いしても、普通は問題な
いと思います。発信国フィルターはあくまで外国語メールのみが対象となる物な
ので、仮に台湾に出張に行った人からメールが届いたとしても、日本語で書いて
ありさえすれば、問題ないです。



 それと、繰り返しになりますが…発信国フィルターを使うかどうかに関わらず、
どっちにしても広告的な意味合いのメールは迷惑メール扱いされてしまう可能性
が高いです。なので、とにかく意図的に配信を受たいケースがある場合は、それ
に対しての信頼ワードを登録するようにしたらいいかと思います。

[ ]
RE:35232 迷惑メール判定についてNo.35233
花音 さん 08/12/24 14:55
 
秀まるお2さん、回答ありがとうございます。


> 発信国フィルターは、メールが外国語メールであることが前提なので、もしか
>してメールが日本語だとうまく判定しませんけど。そういう可能性が1つ考えら
>れるかなぁと思います。

確かに、ZA と判定されたメールは日本語でした。
でも他に、CN と判定された英語のメールも、
X-TuruKame-Filter: unclear
となっていました。発信国フィルタで、「東アジアの近隣諸国」も
オンにしてあるんですけど。。
日本語のメールには発信国フィルタを適用しないというのは、何か
理由があるのでしょうか? 海外にいる(在住や出張を含めて)
日本人からのメールを遮断しないためでしょうか?


> メールの中のReceived:ヘッダの中身から判定しています。Received:ヘッダの
>中に入っているIPアドレスから、「どのIPアドレスがどの国に割り当てられてい
>るか」というデータベースを使って、それで判定しています。

解りました。ありがとうございます。


> 「spam (euro charset)」は、「日本語と英語以外の外国語メールを迷惑メー
>ル扱いとする」がONの場合に、何らかの欧文文字がある程度以上入っているケー
>スに相当します。
>
> 英語のようであっても、たぶん欧文文字が何文字か入っていると思います。欧
>文文字というのは、たとえば「A」の上に点々がついてるやつとかの、ドイツ語
>やフランス語等の言語で使う文字です。

フランス語のアクサン記号とか、ドイツ語のウムラウトのことですね?
当然のことですけど、例えばフランス人の友人からフランス語の
メールを受け取ることがある場合には、「日本語と英語以外の外国語
メールを迷惑メー>ル扱いとする」はオフにしておかないといけない
わけですよね?

一般に迷惑メールは、(読める人が限られている)日本語と英語以外の
言語で送られることはあるんでしょうか?


> ボーランドからのメールについては、単純に「borland」で登録すればいいと
>思います。
>
> microsoftからのメールについては、「microsoft」で登録したのでは多数の迷
>惑メールに誤判定が発生してしまうので、これについては何か適当な信頼ワード
>を考えて登録しないとダメかと思います。実際に配信されて届いたメールがある
>ならば、その中から信頼ワードを決めるのが一番いいと思います。
>
> 秀丸メールの迷惑メールフィルター、基本的に広告的な意味のメールはすべて
>迷惑メール判定してしまいます。なので、意図的に受信したい広告的メールにつ
>いては、信頼ワードの登録が欠かせないです。

それは、迷惑メールの中で、「microsoft」と「borland」では、
使われる(偽装される)頻度が違うということでしょうか?


> それと、繰り返しになりますが…発信国フィルターを使うかどうかに関わらず、
>どっちにしても広告的な意味合いのメールは迷惑メール扱いされてしまう可能性
>が高いです。なので、とにかく意図的に配信を受たいケースがある場合は、それ
>に対しての信頼ワードを登録するようにしたらいいかと思います。

はい、迷惑でないメールが迷惑メールと誤判定されてしまうのは
まずいので、考えてみたいと思います。
この場合、迷惑ワードの見直しというのは効果あるでしょうか?
例えば Microsoft からのメールに(例え商品の広告であっても)
「出会い」「愛人」「不倫」という言葉が含まれているはずは無いので、
そういうワードを含むフィルタだけを設定するという方法もあるかなと
思ったのですが。。


ありがとうございました。



秀丸メールの話とそれてしまいますが、私の所に届く迷惑メールの
「From」欄は、約7割が yahoo.co.jp ドメインです。勿論偽装だと
思いますけど。秀まるお2さんの場合はいかがでしょうか?

[ ]
RE:35233 迷惑メール判定についてNo.35234
秀まるお2 さん 08/12/24 15:32
 
>でも他に、CN と判定された英語のメールも、
>X-TuruKame-Filter: unclear
>となっていました。発信国フィルタで、「東アジアの近隣諸国」も
>オンにしてあるんですけど。。

 一応、こちらでテストした限りでは、

X-TuruKame-Filter: spam (SenderCountry=CN)

 って判定される成功ケースはあるようです。なので、そう判定されなかったと
したら、メールの文字コードの関係か、または発信国フィルターの設定での
「メール本文が小さい物に限る」がONになっていて、メール本文が制限サイズ
オーバーだったとか。

 ちゃんとした理由を調べるためには、問題のメールの受信ログを添付ファイル
で送っていただく手もありますけど…。どうしても腑に落ちないということであ
れば、そういう形で送ってほしいです。送り先は、 maruo@mitene.or.jp です。
受信ログは、問題のメールを選択して「検索・関連するメール・このメールのロ
グ」を実行して「そのまま開く」を選択してOKして出てくるウィンドウで、「フ
ァイル・名前を付けて保存...」で保存してやると生成出来ます。

>日本語のメールには発信国フィルタを適用しないというのは、何か
>理由があるのでしょうか? 海外にいる(在住や出張を含めて)
>日本人からのメールを遮断しないためでしょうか?

 そういうことになります。

 日本語のメールは、迷惑ワードでだいたい遮断出来てるので、あえて発信国フ
ィルターでカットする必要は無いと思います。

>フランス語のアクサン記号とか、ドイツ語のウムラウトのことですね?
>当然のことですけど、例えばフランス人の友人からフランス語の
>メールを受け取ることがある場合には、「日本語と英語以外の外国語
>メールを迷惑メー>ル扱いとする」はオフにしておかないといけない
>わけですよね?

 そういうことになります。

>一般に迷惑メールは、(読める人が限られている)日本語と英語以外の
>言語で送られることはあるんでしょうか?

 あります。韓国語/中国語/ロシア語の迷惑メールはよく届きます。

>それは、迷惑メールの中で、「microsoft」と「borland」では、
>使われる(偽装される)頻度が違うということでしょうか?

 そうです。「microsoft」って単語は迷惑メールによく入ってます。

 microsoftのWindowsを安く販売します、みたいな内容の、いわゆる海賊版ソフ
トの販売目的の迷惑メールが多数あります。

>この場合、迷惑ワードの見直しというのは効果あるでしょうか?

 迷惑ワードについてはあまりいじらない方がいいというか、標準添付の迷惑
ワードをそのまま使うのがいいと思います。

 迷惑ワードまで手作業でいじりだすと、その作業に大変な手間がかかってしま
って本末転倒になってしまうと思います。

 迷惑ワードについては、迷惑ワードの自動アップデートもあるので、そちらも
よかったら参考にしてください。

  http://www.maruo.co.jp/spamword/

>秀丸メールの話とそれてしまいますが、私の所に届く迷惑メールの
>「From」欄は、約7割が yahoo.co.jp ドメインです。勿論偽装だと
>思いますけど。秀まるお2さんの場合はいかがでしょうか?

 たしかにそういうメールは多いし、一時期はその「yahoo」というのを迷惑
ワードの一部として利用してた時期もありました。

 最近は、発信国についての情報を迷惑ワードの一部に使うようになって、それ
で判定精度をあげてます。(++!casaとか++!cnjpとかを多用してます)

[ ]