趣味数学103: 网络“病毒式传播”现象背后的数学模式
计算社会学家沙拉德•戈埃尔发展了一套数学方法来确定哪些现象会造成大规模“精神污染”。
今天2月底,一张照片在几天的时间里传遍了全球,引发了激烈讨论。每个人都为裙子的颜色争论得面红耳赤,而这争论很快演化成了不同群体之间的针锋相对。社交媒体上到处充斥着“蓝黑派”与“白金派”的争论。
类似“裙子事件”这样的现象能否告诉我们信息传播的方式?是什么让它成为“精神病毒”?在《管理科学》(Management Science)上的一篇论文中,沙拉德•戈埃尔(Sharad Goel)和他的合作者提出了病毒式传播的数学定义,以此量化一个概念在朋友之间,而非通过媒体的传播程度。《自然》杂志为此采访了戈埃尔,询问了他的成果在“裙子”问题上的运用。戈埃尔目前是斯坦福大学的一名计算社会学家。
你是如何看待“裙子”照片的快速传播的?
作为一个路人,我觉得整件事情太令人称奇了。人们经常使用“病毒式传播”这个短语,却不知这类“精神病毒”到底是怎么流行起来的。根据我们文章中的定义,那条裙子可以算作一种病毒式传播现象,不过同时它也包含许多非病毒式传播因素。
“病毒式”是什么意思?
所谓“精神病毒”、“病毒式传播”,英文里写做viral/virality,通常作为“流行”的一个同义词。比如一段“viral”的视频,指的很可能就是网上疯传的泰勒•斯威夫特(Taylor Swift)官方发布的MV或者什么的。
而我所定义的“精神病毒”,更倾向于是来自草根发布的、一般人不会认为它会流行起来的东西。而在论文里的更精确的解释是,那些通过十传百,百传千而不是通过公众媒体比如《纽约时报》或者其他一些主流新闻媒体传播的事物。我们称这种通过个人传播的过程称为“结构性病毒式传播”(structural virality)。
病毒式传播现象还有很多其他特点,比如传播速度快、不可预知性,不过这些没有包含在定义中。尽管如此,我认为我们所做的定义已经包含了病毒式传播直观理解下的核心特点。
怎么判断某一事物是病毒式传播的?
我们一般不会确定地说某个事物是不是“精神病毒”,而是根据完全媒体传播和完全个人传播这两个极端,利用连续量表对这个事物进行评估测量。更专业地讲,人们分享的某个具体事物(比如在微博上发一张图片),会形成一个树型图,描绘出这条信息的传播模式。为了测量病毒式传播程度,我们需要计算出树图中任意两次分享之间的平均距离。在完全通过新闻媒体传播的这个极端情况,任意两个分享事件之间只有两次跳跃(因为这两个节点都是直接由同一个媒体信息源发出),所以平均距离是2;而在完全通过个人传播的另一个极端,平均距离会随着树型图规模增长而增长。
根据经验,测量这些距离通常会很困难。在我们的论文中,我们通过推特数据流(推特公司所有推文的原始数据库)追踪了上亿条分享,并尝试评估病毒式传播出现的频率。
“蓝黑还是白金”是所谓的结构性病毒式传播的吗?
是的,不过关于这条裙子,媒体也发布了许多新闻。我第一次知道它正是在《纽约时报》的一篇文章里。我没有花太多时间刷脸书或者推特,所以我并没有被它刷屏,只是通过传统的公众媒体资源了解了一下。媒体相对于个体之间传播的贡献度还不是很清楚。
那条裙子同样引发了热烈的线下讨论。面对面的互动是否是传播过程中的重要一环?
其他人的评论似乎并不是驱动力,但我不知道面对面评论是否也是如此。有时候你可能也会为了看看别人有什么反应而发布一张照片。
是什么让这张特别的照片变得这么火?
部分原因在于,它的本意实际上并不是为了让你产生错觉。如果你意识到某件事其实是在捉弄你,我认为这反而会阻碍传播。这张图片是一个人偶然间发现的,我觉得没有哪个人会料到它会火起来。
如果这个图片发表在了不同的一天或者一个不同的人看到了它,那么可能事件发展的状况会很不一样,可能就不会有这么多人会看到它。这其中有很大的运气成分,这一点是很多人都不会意识到的。我们通常都习惯于决定论的思考方式。
为什么要研究“病毒式传播”模式?
尽管我们对病毒式传播的事件有着集体的、文化上的迷恋,但我们对其背后的驱动力、它们发生的频率以及“病毒式”真正的含义知之甚少。不过,我们已经有足够的数据和合适的计算工具来探明这些问题,这让我感到很兴奋。