|
猫王VS耶稣:网页排名系统告诉我们谁更重要 2014年01月23日
他们进入世界历史的工具是华尔街交易员和棒球队经理最爱的量化分析工具。从一开始他们的兴趣就有别于传统历史,而在于历史编纂学——一门以历史为研究对象的学科。他们试图计算哪个历史人物得到了我们最多最持久的关注。
伊萨克·牛顿、耶稣、亚历山大大帝,我们应该把谁排在第一?猫王排在笛卡尔旁边合适么?
提出这样的问题一度会被人嘲笑。现在就不同了。我们可以理性地把他们拿出来做比较,就像比较Twitter是不是比Apple更值得投资一样。这正是《谁更重要:历史名人到底排第几?》(Who’s Bigger? Where historical figures really rank)的真正目标。作者是来自由纽约州立大学的计算机科学家斯蒂芬·斯基那与谷歌软件工程师查尔斯·沃德。
他们进入世界历史的工具是华尔街交易员和棒球队经理最爱的量化分析工具。从一开始他们的兴趣就有别于传统历史,而在于历史编纂学——一门以历史为研究对象的学科。他们试图计算哪个历史人物得到了我们最多最持久的关注。由于这些历史人物已成为文化基因(memes),所以猫王与笛卡尔的较量就变为这样一个问题:“你什么都不是就是只猎犬”(ain’t nothin’ but a hound dog)与“我思故我在” (cogito ergo sum) 哪一句更有感染力。
答案很明显,因为在历史百大重要人物的名单中,猫王排在69位,而笛卡尔排在82位。这份名单来自斯基那与沃德自创的一套排名算法,他们的灵感来源是谷歌的网页排名(PageRank)系统——关注个人主页上有多少连向其他维基页面的链接。这项测算名为重要性(gravitas),接下来还要结合条目长度、修订历史和每月点击量等,得出两位作者称为知名度(celebrity)的数值。这项数值还要经过“名声衰减度”调整,用来估测某人在淡出人们记忆之后名声将如何下降。
在2010年10月11日这个模型启动的那天,维基百科上共有843790人拥有个人主页。如今他们中的每一位,从耶稣(1)到合气道大师三枝龍生(843790),都被简化成一个数字。
但是似乎耶稣的得分高于三枝龍生,跟笛卡尔的名次排在了猫王之后并不是一回事。为了验证他们的算法,两位作者选取一些在相同小分类中的人物(美国总统,棒球明星),把他们的排名与专家/大众排名或者比赛数据相比较。在检验了一共九个小分类中的数十份列表后,他们发现在他们的排名与那些公布过的名单之间有着0.554的平均相关,显著高于在这个分类中公布过的所有名单之间的平均相关值0.49。
比如说,下面是著名科学家的排名:12 达尔文;19 爱因斯坦;21 牛顿;31 林奈;44 弗洛伊德;49 伽利略; 74 哥白尼; 81 培根; 103 托勒密;112 巴斯德;156 开普勒; 1755 法拉第; 216 胡克; 250 孟德尔; 276 拉瓦锡。
尽管如此,这些互相比较的人物之间并没有真正的联系,那么这样的排名意义何在呢?斯基那和沃德自称他们的分析提供了一个全新的解读历史的角度,虽然听起来这很有前景,但是他们给出的结论要么过于浅显,要么是胡乱猜测。比如说,他们根据历史知名度来计算出耶稣的签名应该价值5780960英镑,由于缺乏古代手稿资料,让事情变得有点棘手。
这实在很有趣,名声之间的对阵是个很不错的娱乐方式。而且聪明的是斯基那和沃德还做了一个手机应用。稍微严肃一点,历史学家将会好好利用量化分析了——他们俩的模型也许能够帮助历史学家与维基百科较量一下。
可是两位作者想把这份排名作为教科书的教育指南,这会带来负面影响。对于11岁以下儿童的教育,斯基那和沃德的想法是尽量选择那些排名靠前的人物而不是那些靠后的人物,并且要把那些排名在5000开外的人“打入冷宫”。
斯基那和沃德的技术是全新的,但是他们对历史的“强人”视角却是完全落伍了。名望是关乎语境的。
|
|