图谱,怎样才靠谱?
有个说法,你现在如果参加互联网圈子的聚会,不说两句pinterest,都不好意思跟人发名片,凑个热闹,今天要说的话题又从pinterest开始。 与pinterest一起走火的,还有个词:兴趣图谱,我不知道是不是因为facebook的马克·扎克伯格在2010年提出开放图谱(Open Graph)之后,各种图谱概念才开始流行。理解“图谱”有利于理解博客以来的互联网演化线索。
我之前说过从博客到微博过程中出现的信息泡沫化问题,博客是以记录内容为主的,微博则强化了人与人之间的传播,加强传播,优点是方便了信息传输,缺点是太方便了传播 —— 口水遍地导致了信息泡沫。类似facebook的sns社区,由于关系组织比微博紧密,但也面临同样的信息泡沫问题。
从早期互联网以内容为中心的组织,到社交时代以用户为中心的组织,互联网的传播特性大大加强,满足了多样化的信息服务要求,随着用户在网络上使用信息的增多,日渐面临信息有序流通的压力。
内容为中心的组织效率比较低,内容本身是“活”的,内容不断地更新就需要不断地组织,互联网早期“苦逼”的编辑们对此应该记忆犹新;以用户为中心的组织,只需要组织一次,此后的内容就按照用户的关系来组织,解决了“活”内容的组织问题。
不过,看似省事儿的背后,并没有很好地解决问题,信息虽然与人的关系密切,却未必与人的关系完全拟合。早期,一个人常常集中发同一类的信息,比如财经作者更多聊财经话题,创业者更多聊创业话题。随着网络沉淀的人增多,具有讽刺意味的是,随着每个人变得丰富起来,他在网络上表现得越饱满,以人为中心的信息组织就越无效。你是热衷于听邻居与女友间的喃喃细语,还是热衷于听老爸与战友间鸟语般的俄语对话。
具体内容的组织效率太低,而顺着人来的信息又杂乱无章,互联网进入第二次黑障(第一次是web2.0流行之前,大量内容型网站形成信息孤岛),这时候,“图谱(Graph)”来了。
如何理解图谱呢?以兴趣图谱(Interest Graph)为例,按照流行的说法,以兴趣爱好作为内容的组织方式。看上去,它是介于用户和内容之间的一种组织工具:不是用户间那样的固定关系,也不用伴随每一次内容发布那样细碎。兴趣图谱以兴趣为基础,建立了零散的内容之间的关系。
具体到facebook,开放图谱(Open Graph Protocol)作为facebook为第三方网站提供的开放协议,把第三方网站的服务通过facebook连成跨越网站的“图”,这样,零散的第三方网站服务,就被组织到了一起。
由此可见,图谱是一种比单个内容更高一层的信息组织结构,提供了信息的有序性:信息秩序。
如果你只想了解一下图谱的概念,到这里就结束了。如果你对得到有效信息秩序的过程感兴趣,可以继续往下看:
是不是所有的关联都能利用起来,成为构建信息秩序的有效服务呢?
未必,在博客时期,聚合阅读(RSS订阅),也曾是早期博客阅读者的工具,但最后没有成为大面积使用的服务,现在反过头看,聚合阅读、标签只是简单的把文章放到了一起,虽然简化了阅读,但在优化信息源让信息流动起来上做得不够好,工具本身也过于技术化,普通读者难于理解、使用起来也比较麻烦。
一种工具如果不能形成更高层次的信息结构,而只是简单归类,也难以成为新的信息工具,比如标签(TAG),利用标签对信息进行归类的时候,标签与标签之间的关系往往难以确定,当你利用标签进行分组管理的时候,就缺乏稳定性,比如一个企业融资信息,第一次可能放到“投资”标签下,下一次可能就放到了“企业”标签下了,直接使用文本化的标签,对于缺乏信息分类训练的用户,就很难有效。
对于“图谱”,可以作进一步类比理解,就像物理学里提到的光谱,光谱中,同一种元素会形成多个独立的谱线,一个混杂的光谱中,通过找到各自对应的化学元素,就可以方便地对光谱中的各个谱线进行区分,元素光谱是杂混在一起谱线的组织结构。
兴趣图谱起什么作用呢?在零散的互联网信息与互联网行为中,通过找到用户间的兴趣线索,就可以方便地对这些零散的信息进行区分,图谱是离散网络信息的组织结构。
如何区别比离散信息更高级别的信息结构呢?
如果我们从分子的级别看,一杯雪花和它溶化之后的水是一样的,但是,如果我们采用比分子更大的尺度来看,雪花具有数厘米尺度的六边形的空间结构,而液态水没有。六边形雪花是水通过结晶的方式实现的。
要让小结构聚集成更大的结构,需要内在的动力。同样的100个工人,如果没有人统一指挥,他们在一片空地上,只能码出一片矮矮的没有外形的砖垛,如果有人提供图纸,他们就可以盖出一间间瓦房甚至数百米高的大厦,这是同样的微观行为是否能够构建大尺度结构的区别。(文/醒客)
|