Coremail XT Anti-spam GT 技术白皮书
,本文档是COREMAIL 的系列技术文档之一。未经许可,任何公司和个人不得将此文档公开、转载或以其他方式散发,否则必将追究其法律责任。⏹ 联系方式网址:http://w



本文档是COREMAIL 的系列技术文档之一。未经许可,任何公司和个人不得将此文档公开、转载或以其他方式散发,否则必将追究其法律责任。
⏹ 联系方式
网址:http://www.mailtech.cn
广州
地址:广州市中山大道科韵路16号广州信息港网易大厦3楼
联系电话: 86(20)85106566
⏹ 北京
地址:北京市西城区西外大街1号院西环广场T3座7层B7-B8 邮编:100044 联系电话: 86(10)58301930
⏹ 上海
地址:上海市静安区长乐路672弄33号B 幢3楼
联系电话: 86(21)61103951
⏹ 成都
地址:成都市高新区永丰路47号玉林商务港5楼518室 邮编:610041 联系电话: 86(28)66252331
⏹ 版本信息
软件版本:GT 104 文档版本:1.0 发布日期:2009年10月 传真: 86(28)66252332 邮编:200040 传真: 86(21)61107756 传真: 86(10)58302888 传真: 86(20)85106595 邮编:510665
,

盈世信息科技(北京)有限公司
目录
1
2 产品功能概述............................................................................................................ 1 Anti-spam GT反垃圾效果 ........................................................................................ 2
✓ 高过滤率低误判率.............................................................................................. 2
✓ 适应邮件系统运营商大规模运行......................................................................... 4
3 Anti-spam GT智能管理 . ........................................................................................... 5
✓ 采用过滤规则数据库,智能化管理 ..................................................................... 6
✓ 邮件日志跟踪..................................................................................................... 6
✓ 智能统计,提升工作效率 ................................................................................... 7
✓ 实时更新过滤信息库(Live Update) ................................................................ 9
4 Anti-spam GT反垃圾技术 ...................................................................................... 10
✓ 质询-响应机制 ................................................................................................. 10
✓ 自动白名单 ...................................................................................................... 10
✓ Spam URL Realtime BlackList . ........................................................................... 10
✓ 邮件评分技术................................................................................................... 10
✓ Bayes 算法 ........................................................................................................11
✓ IP 声誉评估系统................................................................................................11
✓ 指纹算法(Fingerprinting ) ..............................................................................11
✓ 灵活的反垃圾邮件策略设计.............................................................................. 12
✓ 流技术+多线程+优化网络访问架构................................................................ 12 5
附录........................................................................................................................ 13 ✓ 系统运行环境说明............................................................................................ 13
I 共 16 页
,

盈世信息科技(北京)有限公司
1 产品功能概述
电子邮件是最常用的网络应用之一,已经成为人们信息化交流的重要途径。由于网络的开放性,垃圾邮件也给许多人带来了不少的烦恼。据近来的最新研究统计,有超过94的网民对收到大量垃圾邮件而不满,垃圾邮件的危害不仅表现在内容的上,而且浪费了大量的邮件下载时间、占据了带宽,还严重影响了企业正常的业务应用,影响了电子邮件服务供应商的服务质量。
据中国互联网协会反垃圾邮件中心最新发布的2008年第一季度反垃圾邮件状况调查报告中调查显示,有高达93.83的企业用户都收到过垃圾邮件,只有6.17的用户表示没有收到过垃圾邮件。而中国网民每周收到垃圾邮件的比例为高达56.70。
面对来势汹汹的垃圾邮件,用户最期待的目的就是能够有效地解决垃圾邮件,以提高在工作中的效率。Anti-spam GT 为用户提供目前市场上技术最为成熟的反垃圾邮件功能,力求解决邮件系统面对的垃圾邮件问题。
Anti-spam GT 使用多项反垃圾邮件的新技术,包括智能生成垃圾邮件规则、自动定期更新、实时邮件指纹检查、自动过滤 人工控制的双层机制、探针邮箱等。经过多层次优化,提升系统的垃圾邮件处理性能。
严格的实际运行测试数据表明:Anti-spam GT 除了拥有世界级的智能化管理外,对于垃圾邮件的判断与过滤拥有更高的正确率和更低的误判率,获得更快的邮件处理速度。
1 共 16 页




盈世信息科技(北京)有限公司
2 Anti-spam GT反垃圾效果
Anti-spam GT 垃圾邮件过滤系统提供了详尽的过滤规则,包括IP 过滤、信头过滤、信体内容过滤三大类,最有效地覆盖了识别垃圾邮件所需的全体特征。
高过滤率低误判率
经过统计,使用Anti-spam GT 垃圾邮件处理系统的多个客户系统(包括大型免费电子邮件运营商、企业邮件系统应用等),合理配置的Anti-spam GT可以达到非常高的垃圾邮件正确识别率,并且将正常邮件判断为垃圾邮件的误判比率也很低。
【注意】下面给出的数据截取自Coremail 的两个客户,他们在实际运行Anti-spam GT 中曾经获得这些数据,但对于不同的客户情况及不同的运行环境,该类数据会有一定差别。
在没有使用任何防垃圾邮件系统时,客户系统的电子邮件用户必须从大量垃圾邮件中查找有用的信件,系统接收的垃圾邮件比率非常高。下图是我们客户甲的汇总统计图表。从统计图表我们可以看到,应用Anti-spam GT 防垃圾邮件系统后,该客户过滤了97.8%的垃圾邮件,大大减少了用户处理垃圾邮件的时间。
2 共 16 页
,

盈世信息科技(北京)有限公司
客户甲 - 邮件过滤汇总统计
从图表我们可以清楚地看到,仅仅在2008年5月一个月内,该客户的Anti-spam GT系统接收到总邮件总数为5,546,866封,其中正常邮件数为122,472封,仅占系统处理邮件总数的2.2,而垃圾邮件却多达5,424,392封,占系统接收邮件总数97.8。图表表明,如果没有采用Anti-spam GT 反垃圾过滤处理系统,用户平均每天需要在100封电子邮件里面才能查找到2封真正有价值的电子邮件!
3 共 16 页



盈世信息科技(北京)有限公司
客户乙 - 邮件过滤汇总统计
上图是我们另一个客户乙的汇总统计图表:在2008年7月整一个月的时间里,该客户的Anti-spam GT 系统处理的总邮件数为3,342,322封,正常邮件有58,874封,占系统处理信件的1.8,而垃圾邮件达到3,283,448封,占系统总邮件数的98.2。这些数据表明,Anti-spam GT 系统使该电子邮件系统的用户从大量垃圾邮件中解脱出来,每天减少至少95%的邮件处理时间。
配合系统为终端用户提供的个性化设置方案,终端用户还可以选择垃圾邮件的处理策略,如直接删除或者转发到指定邮箱等。Anti-spam GT 的出色表现,极大地减轻了电子邮件用户每天用于处理垃圾邮件的时间,用户的使用满意度远远超越同类邮件系统产品。 适应邮件系统运营商大规模运行
经过Coremail 客户实际运行的结果表明,Anti-spam GT可以准确判断各类型垃圾邮件,甚至在两天内为我们的客户甲成功处理了1,109,115封邮件,并以94.3的高处理效果过滤 4 共 16 页



盈世信息科技(北京)有限公司
了1,045,351封垃圾邮件。
源于研发中心在超大规模邮件系统应用的丰富经验,Anti-spam GT 在系统架构实现上采用了多项设计,包括多进程/多线程、流程优化、多级缓存Cache 等,使得系统在超大规模邮件系统应用上依然表现优异。
下图为系统详细统计的曲线图,显示某客户在一天内(以小时为单位)邮件系统所处理的正常邮件数、垃圾邮件总数。该图可以看出Anti-spam GT 在邮件系统每个小时处理的电子邮件达到超过50,000封以上时仍然运行稳定。
普通统计曲线图
某客户邮件过滤的统计曲线
3 Anti-spam GT智能管理
Anti-spam GT 改变传统的规则设置方式,将自动化管理的理念带入反垃圾邮件系统,改变了传统的依靠管理员手工输入过滤规则的方法。通过客户系统管理人员的反馈结果表明,Anti-spam GT 的系统管理十分简便,极大地节省了邮件系统在系统管理方面的人力资源开销。
邮件过滤统计对Anti-spam GT 的各项运行数据进行统计。通过查看统计数据,不但可以了解系统的运作状态,还可以为系统管理员更新系统设置、调整过滤规则等提供重要的信息,从而提高系统的运行的效率。同时,通过系统提供的邮件处理日志管理,管理员可以回溯查找到具体的邮件处理过程,从而准确地判断邮件无法接收或者投递的原因。

5 共 16 页
,

盈世信息科技(北京)有限公司
✓ 采用过滤规则数据库,智能化管理
Anti-spam GT对邮件采用发信IP 、邮件格式、邮件内容三个部分进行判分处理,从而生成系统的过滤规则。同时由技术人员采用自行设计的陷阱邮箱,对采样所得到超大批量的邮件数据通过研究分析,保证系统生成的规则具有普遍适用性。应用规则数据库过滤邮件,可达到判断垃圾邮件正确率高而误判率低的处理效果,从根本上解决如洪水般涌入的垃圾邮件。


✓ 邮件日志跟踪
系统保留垃圾邮件过滤的处理信息,即系统的日志。邮件日志跟踪的时候可以点击进去看更详细的投递信息。管理员可以根据系统的日志信息,回溯查找到具体的邮件处理过程,从而准确地判断邮件无法接收或者投递的原因。
6 共 16 页
,

盈世信息科技(北京)有限公司
智能统计,提升工作效率
汇总统计
系统管理员需要统计某一个时间段内的邮件过滤情况,需要在查询面板中按提示输入开始日期以及结束日期,查看该时间段内系统处理的垃圾邮件比率,统计结果以清晰直观的图表显示如下图。

统计报表
统计报表页面功能以小时为单位显示系统的邮件过滤情况。每个图表页面配备相应的报表生成功能,管理员可以直接将统计结果输出。

域邮件接受情况统计
域统计是Anti-spam GT 按系统接收或者发送的邮件所属的域名进行分类统计,可以分 7 共 16 页