最近,やたらとスパムメールが inbox に入ってくるようになった.スパム対策は,milter-greylist と SpamAssassin で行っているが,それをすり抜けてやってくるのだ.これらのゴミメールをゴミ箱に取りのけて,SpamAssassin に学習させる手間は,まさにコンピュータに使われている気分にさせられる.
メール自動振り分けの古典的ソフトウェアである procmail の設定に,NG ワードでスパムメールをゴミ箱行きにする振り分けルールを追加した.スパムメールに特徴的に出現する文字列を引っ掛ける古典的な手法である.NG ワードリストファイルを参照して grep し,該当する文字列がメールのヘッダ部あるいはボディ部に現われたら,そのメールを spam ディレクトリ行きにする..procmailrc に以下のように追加した.
NGWORDS=/usr/local/etc/mail/ngwords ... # Subject のみチェックする場合 :0: * ? test -s $NGWORDS * ^Subject:\/.* * ? echo "$MATCH"|nkf -meZ2|sed -e 's/[[:space:][:punct:]]//g'|fgrep -iqf $NGWORDS spam/. # ボディもチェックする場合 ($NGWORDS は EUC エンコード) :0 B: * ? test -s $NGWORDS * ? nfk -meZ2 | sed -e 's/[[:space:][:punct:]]//g' | fgrep -iqf $NGWORDS spam/. ...
テキストファイル (上記では /usr/local/etc/mail/ngwords) に NG ワードを記述しながら情けなくなってしまった.まあつまり,このファイルにオ (ピー) ンコだの有閑マダムだの,恥ずかしい言葉をだらだら記述しておく訳である.対象メールテキストの記号類・スペースを詰めてから NG ワードと比較することにより,"Penis" も "P*e*n*i*s" も "PENIS" も,要するに延びたり縮んだり膨らんだりしても,引き当てることができるという訳である.このため,欧文の NG フレーズを登録するときはスペースを除去しておく.真面目な文脈で使われることはなかろうと思われる言葉に絞らなければならない.NG ワードを含んでいても,きちんとした目的をもった私宛のメールがまったくないとも限らないのが,また一方でそういう楽しい話題のメールもゴミ箱行きとなるのが,悩みである.
ところで,日本と海外のスパムメールを比較すると際立った差異があって,ある意味で面白い.日本のスパムは,出会い系もしくは悪徳エロサイトへのリンクが主であって,その文面は,アタシさびしいの,待ってるワ風の勧誘がほとんどではないだろうか.そこには人間関係の希薄さに訴えるものが多いように思う.「さびしい」がキーワードである.それに対し,海外のスパムは,あなたの Dik を2割増大させますだの,バイアグラをウルトラディスカウントしますだの,「それ」の準備をお手伝いします風が多い.もしくは高級時計の激安売り込み,カジノの勧誘である.直截で目的がハッキリしている.こんなところにも国民性が出るものなのだろうけど,日本人はさびしいのかと思ってしまう.スパムメールで現代ネット世相を研究する社会学者もいるのだろうか.

Comments