content

抓垃圾电邮 IBM请出钟馗

 2004-08-26 04:18 桌面版 正體 打赏 0
〔自由时报编译张其贤□综合报导〕美国“国际商业机器公司”(IBM )的科学家,运用分析基因序列的技术,开发出一种反垃圾邮件的演算程式,阻挡成功率接近九十七%。

根据英国广播公司(BBC )报导,纽约IBM华生研究中心的研究人员利古佐斯和田惠恩(译音 ),将基因学家计算蛋白质注解的基因序列时所使用的一种演算程式“泰瑞西亚”,应用到辨识垃圾邮件上,并将这种新的程式命名为“钟馗”。

利古佐斯表示,垃圾邮件会含有某些字元序列模式,这些模式不会出现在非垃圾邮件中。研究人员对大量垃圾邮件进行分析,建立出一套垃圾邮件经常包含的字元序列模式,这些模式相当于某种“字汇”。利用这套字汇组成的资料库,“钟馗”就可以辨识垃圾邮件。

“钟馗”的运算原理是“模式发现”,而非“模式吻合”(如以邮件的来源、途径、身分认证或安全名单等明确资讯串为对象,对邮件进行搜寻过滤 )。只要邮件中出现高频率的垃圾“字汇”,就会被判定为垃圾邮件。

在六万六千封垃圾邮件与二万二千封非垃圾邮件的混合中,“钟馗”成功辨识出绝大多数垃圾邮件,成功率高达九十六点五%。

利古佐斯说,“钟馗”的辨识能力极强,只要“字汇”在邮件中出现两次或两次以上,邮件就会被抓出来,即使出现位置在邮件内容以外的地方也一样。现在许多垃圾邮件以“S”代替“$”来逃避过滤程式,但这种障眼法也骗不过“钟馗”。此外,“钟馗”会透过不断学习扩大其“字库”。

“钟馗”所根据的“泰瑞西亚”程式,也是华生研究中心的研发成果。它的命名取自希腊神话中著名的盲眼先知泰瑞西亚,理由是这种演算程式并不知道它所要寻找的明确基因模式为何,它只是在大量的基因资料中,发现到某些反覆出现的模式。基因学家利用这些模式,解释疾病与基因缺陷的关系。

--版权所有,任何形式转载需看中国授权许可。 严禁建立镜像网站.
本文短网址:


【诚征荣誉会员】溪流能够汇成大海,小善可以成就大爱。我们向全球华人诚意征集万名荣誉会员:每位荣誉会员每年只需支付一份订阅费用,成为《看中国》网站的荣誉会员,就可以助力我们突破审查与封锁,向至少10000位中国大陆同胞奉上独立真实的关键资讯,在危难时刻向他们发出预警,救他们于大瘟疫与其它社会危难之中。

分享到:

看完这篇文章觉得

评论

畅所欲言,各抒己见,理性交流,拒绝谩骂。

留言分页:
分页:


Top
x
我们和我们的合作伙伴在我们的网站上使用Cookie等技术来个性化内容和广告并分析我们的流量。点击下方同意在网络上使用此技术。您要使用我们网站服务就需要接受此条款。 详细隐私条款. 同意