July 25, 2003

過瀘信件

單用 pattern 的檔信方式, 檔不勝檔, 試試貝式分析式的瀘信軟體
spamprobe

bogofilter
bogofilter -s < spam.mbx
bogofilter -n < ham.mbx

bayespam

spambayes

spamoracle

Posted by pank at July 25, 2003 09:13 AM
Comments

有沒有人試過貝式分析的 mail filter 軟體?
比較完整的就以下幾套
http://bogofilter.sourceforge.net/
http://spamprobe.sourceforge.net/
http://spambayes.sourceforge.net/
貝式分析的做法是一開始餵給他兩份資料
一是 spam, 一是正常的郵件, 讓程式去分析統計,
database 存放著 keyword 的評比, 如 sex 這個字是 spam 的可能性就極高,
一開始餵的資料料愈大, 就愈準確
可以隨著時持續學習
http://lwn.net/Articles/9460/
這篇文章中, 有一段是 SpamAssassin 和 Bogofilter 的比較
在 database 大到某個程度, Bogofilter 的表現就優於 SpamAssassin
可惜的是, 試了 bogofilter 和 spamprobe 後,
不曉得是不是中文分析上有問題, 結果好像沒效?!

Posted by: pank at August 13, 2003 10:40 PM
Post a comment













Remember personal info?