中国特色。NET

网络信用系统(三)

在正文之前必然有废话。
song说我在灌输不是在讨论,如果你读了The Meme Machine就会知道,Blog作为一个Meme聚合体,在本质上就是要寻求自身的复制。说简单一点,写Blog本质就是布道。况且我又不是没开评论。
说我《网络信用系统》幼稚,对这点我完全的接受,我在(一)里面就说过,这篇文章本来就是初学者入门级的文章,你觉得幼稚,你可以反馈给我一些更深刻的内容啊。一方面说我在布道,另一方面又不肯参与,好像是我没给你机会?

和菜头最近提到在网络上甄别信息真假的难度空前提高,我仍然认为这篇文章有必要继续下去。
有意见和建议,可以在评论中提出来。
觉得实在臭不可闻,也可以退订。

三、信用系统模型

有了前文的基础,这个模型的建立非常简单。
每个新闻源都有自己的信用度,每个新闻也有对应的信用阈值。
对于某个事件来说,将所有发表了该新闻的新闻源的信用度相加,如果超过了该新闻所需的信用阈值,则该新闻判别为真。这是一个数学化的表达方法,换作日常的表达,四个字:三人成虎。
唉,三人成虎不是这么用的吧?
所以这个模型当然有修正的地方。

根据新闻源的分类,二手新闻源相互转载是不会重复累计信用度的。甚至可以说,二手新闻源自身是没有信用度的,它的信用度完全来自于它所转载的一手新闻源。
但另一方面,二手新闻源又是相当重要的,因为一个良好的二手新闻源,其实已经对一手新闻进行了甄别。而且毫不夸张的说,这种甄别相当的耗费时间。(保守的说,我每天都会花掉3个小时阅读各种新闻,然后评论和共享之。)

每个新闻也有不同的信用阈值,这点不可忽略。
举例来说,贵州瓮安市民放火烧了警察局,和深圳市民放火烧了警察局,这两条消息,需要的信用度是不一样的。我不是说深圳市民就比瓮安的要文明,我的意思是,大城市的警察比小地方的密度高,想要烧掉警察局,那还真是很不容易的一件事情。

四、信用度的建立和传递

依靠什么来判断一个新闻源是否值得信赖?这个问题和Google判别垃圾网页有着相似的地方。
传统来说,判断一个新闻源的信用度,只要从这个新闻源已经发表而且被证实为真的新闻数量/比例来看就对了。这样做显然有些麻烦,你必须回头去找每一个新闻源的历史存档,看看他们报道过什么。而且还得警惕他们可能作弊删除或修改以前的稿件。
因此有一个变通的办法,假设你已经确定一个高信用度的二手新闻源,可能是你的朋友,可能是某份网络杂志如草莓周刊。那么这个新闻源经常引用的前一个新闻源也是可信的。是不是像PageRank或是人际关系的传递呢?
依据这个传递的原则,你可以找到大量的可信新闻源,多到你信息过载。
由此可以看到,retweet在twitter的意义。

Exit mobile version