2004年5月 5日アーカイブ
SPAMメール対策として、POPFileというツールを使っています。
ペイズ推定を利用したPOP3フィルタで、かなりの精度でSPAMを判別してくれます。
かなりオススメです。
ところが、このフィルタをかいくぐってやってくるSMAPがまだいます。
POPFileの「学習」が足りないのかと思って、マメに訂正してやってたんですが、それでもやっぱり時々やってくる。
不思議に思って、いつもならゴミ箱に直行のそれらのSPAMを見てみると・・・
- テキストが全くないメール
広告が全面画像で出来ていて、テキストが全くない。
(文字部分も画像になっている)
判別の判断材料にしているテキストが全くないとなると、POPFileにはどうにもできない。
- こっそりと、無関係なテキストが隠してあるメール
コメントアウト(<!-- ~ //-->)の中に、広告とは無関係のテキストがたくさん入れてある。
全体の単語数を水増しすることで、「SPAMである」と判断されるような単語の重みを軽減しようとしている。
・・・なるほど。
結局はSPAM業者とのイタチごっこということになりますか。
何かねぇ、ホントSPAMってどうにかならないんでしょうか。
どうにもならないんでしょうねぇ。むぅ。
それにしても、フィルタリングされるものもされないものも、薬品関連の売り込みの多いこと。
主にバイアグラなんですけどね。
アレですか、そんなに海の向こうの男性はそっち方面のお悩みを抱えていらっしゃるんですかねぇ。
・・・ま、お大事に。