content

论中科院声学所“法轮功内容审查系统”的不可行性

 2003-02-24 06:23 桌面版 正體 打赏 0
中新网2月18日中国科学院声学所把网络过滤技术用于“法轮功内容审查系统”的消息报导后,我给声学所参与了这个系统开发的有关人员打了电话,试图弄明白他们是怎么把不可能实现的系统推出来的。
这项实际上属于通用语义立场判断系统的网络过滤技术,其基础是HNC自然语言处理技术(国家“973”计划项目G1998030506)。该技术以中科院声学所黄曾阳研究员创立的概念层次网络(简称HNC)理论为指导。HNC理论认为:自然语言理解的本质是概念联想脉络激活、扩展、浓缩、转换与存储的全过程运作。换言之,这一处理方案,使计算机能够理解自然语言的概念,在“懂”的基础上完成对自然语言的各种处理。该技术在汉语语句理解处理方面居国际领先水平(注意,这里指的是HNC技术,不是“法轮功内容审查系统”)。

我虽然不是什么专家,不过这个“法轮功内容审查系统”的描述实在是荒谬的可以,特别是竟然声称可以进行意识形态过滤,很想听听研制者是怎么解释的。电话打过去,我提出了我认为这个系统是不可能实现的理由。

一个语言概念识别系统,必须对被识别的系统有深入的理解。而对一个完整理论体系的理解,会带有研究者非常强烈的主观色彩,即不同的研究者会得出完全不同的结论。因此,采用那一种理解是最困难的。至于编程部分反倒是最简单的了。因此,在中国当前学术研究受政治干扰,基本没有研究自由的情况下,对世界重大的哲学宗教体系的研究是很落后的。比如中国宗教研究所所长就曾撰文指出对神的信仰是很可笑的(这也叫宗教研究?)。这就注定了在目前,就意识形态而言,语言概念识别系统只能在句子和段落的水平上进行最原始的识别,也就是比关键词过滤稍微好一点吧。这个识别系统当前在意识形态方面的有效应用领域是极其有限的。

当然人是最不能承认自己的研究成果是一堆废物。一位参与研制的人士很专业的和我谈起计算机语义识别的原理,用了很多我不懂的术语。我直截了当地告诉他,任何计算机系统,在当前只能是对人的识别的拙劣模仿,特别是在意识形态上(象棋这类只牵涉到机械步骤的除外)。因此,在让计算机识别前,得有人先来识别,由人喂给计算机一个标准。问题是,谁来定这个标准,谁有能力给任何一个理论体系定一个量化的标准?在我重复了三遍以后,这位终于承认这个问题超出了他的理解能力。

这还是对已经成熟了的理论体系的研究。而法轮功问题更有其独特性。最大的和这个审查系统有关的特点是,法轮功的教导,和江集团在镇压时所说的法轮功的教导完全是风马牛不相及的。因此,在建立“概念”时,第一步就遇到困难:是建立法轮功自己的概念呢,还是建立中共喉舌强加给法轮功的概念?如果使用后者,那就封不了法轮功的信息,如果用前者,那所有相关人员就必须下功夫认真研究法轮功的书籍和文章。而今天在中国,可以说根本就没有关于法轮功的研究,任何研究都不能超出官方的口径。就凭声学所这些人能研究出个什么名堂?不要说声学所,就是社科院又怎么样?其结果会是什么呢?可能有人因此而知道了法轮功的真相,这可和开发者的初衷大相径庭了。还有一种可能,就是把研究者逼上绝路。

大凡人都不愿意承认自已在有意识的做坏事,所以总要找个冠冕堂皇的理由。所以警察就闭上眼睛说自己在执行法律,所以写文章的只能对政府告诉他们的其实并不属于法轮功的“理论”来加以“批判”,他们可以不用去研究真正的法轮功是怎么回事。而要做“概念分析”,就得真的知道法轮功教人的是什么。而当他们搞清楚法轮功其实是教人做好人,而不是政府说的教人“自焚”“杀人”时,就不再有任何理由为自己的行为辩解。也就是说,他们必须明明白白的做坏人,明明白白的知道自己在助纣为虐,明明白白地把良心出卖给魔鬼。如果这个人道义尚存,那不是让他一辈子背上良心的重负?那不是把他逼上绝路?

至于产品本身,大概就是能识别一些观点和表达都非常明确的句子和短段落。再就是骗骗中新社记者那样的低能儿和“评审委员会”的官僚们,再多花一点人民的血汗钱。当然,也有可能由政府出面强迫各单位购买这一伪劣产品。不过,赚这种昧良心的钱是要还的,要还的就远远不止是这点钱了。

(文章仅代表作者个人立场和观点)

--版权所有,任何形式转载需看中国授权许可。 严禁建立镜像网站.
本文短网址:


【诚征荣誉会员】溪流能够汇成大海,小善可以成就大爱。我们向全球华人诚意征集万名荣誉会员:每位荣誉会员每年只需支付一份订阅费用,成为《看中国》网站的荣誉会员,就可以助力我们突破审查与封锁,向至少10000位中国大陆同胞奉上独立真实的关键资讯,在危难时刻向他们发出预警,救他们于大瘟疫与其它社会危难之中。

分享到:

看完这篇文章觉得

评论

畅所欲言,各抒己见,理性交流,拒绝谩骂。

留言分页:
分页:


Top
x
我们和我们的合作伙伴在我们的网站上使用Cookie等技术来个性化内容和广告并分析我们的流量。点击下方同意在网络上使用此技术。您要使用我们网站服务就需要接受此条款。 详细隐私条款. 同意