朴素贝叶斯垃圾邮件过滤问题

4
我计划使用朴素贝叶斯分类模型来实现垃圾邮件过滤器。虽然网上有很多关于朴素贝叶斯分类的信息,但问题是其中包含了大量的数学内容,不够清晰易懂。而我更倾向于编程而非数学(虽然我在学校学过概率和贝叶斯定理,但已经很久没有接触了,也没有时间重新学习(只有将近三周的时间来完成一个可行的原型))。所以如果有人能向程序员解释或指出可以让程序员理解的地方,那将是非常有帮助的。顺便说一下,我需要用C语言来实现它。 :( 致敬,Microkernel

3
咬紧牙关学好数学。如果你不这样做,你将永远没有提高自己的希望,只会成为更大游戏中的棋子。 - ldog
@gmatt:是的,我同意你的观点。但并不是因为我不擅长数学或者讨厌数学。恰恰相反,在学校时,我的最爱科目就是数学。但现在我没有时间重新学习和实践(考虑到我只有三周的时间来完成这个项目,并且需要用C语言来实现,这是一个周末班的项目,除此之外,我还有一份全职工作(不用说也知道会耗费我很多精力))。但我仍然非常赞同你的观点,我真的想学习。谢谢 :) - Microkernel
5个回答

5

这本书《集体智慧编程》有一章涵盖了这种方法和其他方法。第6章可以独立理解,写得清晰,并且只讨论必要的最小数学知识以完成工作。


2
你可以尝试访问这个网站,它有一些源代码。

2

1
你也可以看一下POPFile,这是一个开源的垃圾邮件过滤引擎。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接