为什么迪迦在16世纪就变成了光?
想象一下这样的世界:在17世纪,蜘蛛侠和高达为争夺一个比特币,在纽约上空大打出手。而地面上,牛顿正拿着崭新的iPhone13记录着这一切。
这个荒诞的世界,或许只会存在于更加荒诞的元宇宙当中,但当我们翻阅历史,会发现其确实真实“发生”过,而且有着丰富的“史料”作为支撑。
1
最近在国外就刮起了一股挖掘这些“历史”的考古风潮。在TikTok和Youtube上出现了很多“1700年的泰拉瑞亚”“1570年的蜘蛛侠”等,光题目就透露着离谱的视频。
视频内容无一例外都是这样的套路:
第一步:在某神秘页面中搜索一个单词,得到一份折线图,从中能得知该单词在从古至今各个年份,被使用的频率;
第二步:找到该单词出现频率最高的那个年份;
第三步:将该年份的文艺作品、大事件,与单词进行结合,构成一个平行世界,挑战着人们对时间线的认知。
在这里,莎士比亚吃着哈根达斯玩堡垒之夜;二战的转折点不是斯大林格勒战役而是高达出动;旧时代的贵族们抱着P90集体Rush B。
“国王先生,请给我发把狙,秋梨膏!”
而构成这个魔幻宇宙的万恶之源,就是Google的一项“黑科技”——Google Ngram。
Google Ngram是谷歌研发的一款针对学术研究的工具,可以检索某个词语在特定年份的书籍中出现的频率。该工具收录了从1500至2019年间出版的上千万本各类书刊,数量大约占人类有史以来书籍总量的12%。
例如搜索汉字“的”,会得到这样的图像。
可以看出“的”这个字出现频率最高的年份在1956年,接近8%,这就意味着Google Ngram所收录的该年份典籍中,每100个汉字里,就有大约8个“的”。
而正如文章开头所说,这样一个学术利器,到了网友们手里却走上了“歪路”,被塞满了整活儿的属性。
有人发现,一些现代社会中经常被使用的词,在某个距今相当久远的年份,竟有着极高的使用频率——例如搜索TikTok(抖音),会发现其出现频率在1914年有奇怪的高峰。
于是,互联网上掀起了一场现代版的文艺复兴运动,人们乐此不疲地在Google Ngram中搜索各种“现代词汇”,并试图找到那些与该词汇相当违和的古老年份,之后利用当时的油画或影像作为载体,将二者进行融合,以表明自己发现了不得了的“隐藏历史”。
在这场运动中,无数尘封的历史“真相”得以重见天日,例如Minecraft中的史蒂夫参加1945年柏林战役的珍贵影像。
而对此,又有人进行了深入剖析,直言这里的“Minecraft”指的应该是希特勒的著作《Mein kampf》 (《我的奋斗》德语,读音近似Minecraft)
地狱笑话了属于是
搜索给她爱,你会发现早在1771年,世界上就诞生了第一幅自带语音的名画。
搜索Java会找到1817年的上古码农:
如果你是一个数码控,则不妨来看看1661年的RGB。
而这股越吹越盛的风潮,也从外网刮进了国内,B友们发现,某些不知名的历史角落中,其实也存在着众多国人熟悉的身影。
比如在Google Ngram中搜索迪迦,会发现上帝创造世界的真相,其实隐藏在米开朗基罗创造的隐藏版壁画《创造迪迦》中——上帝说要有光,迪迦就变成了光。
元宇宙也不是今年才刚刚兴起,搜索“VR”,我们就能看到早在文艺复兴时期,油画《最后的VR战士》中就记载了初代头号玩家在耶稣接受审判前,与其共进晚餐的画面。
我将以高达形态出击
搜索shabi,会发现在美国建国那天,整活国父虎哥·华盛顿发表了内容为“所有目光向我看齐,我是个shabi”的《独立宣言》,宣告整活帝国的正式建立。
1776年的shabi
至于整活帝国的继承者们,则在20世纪初横扫西洋,铁蹄踏遍了世界的每个角落,成为了又一个“日不落帝国”。
2
很多人认为,这些“尘封历史”的出现,是大数据和人工智能的一次大失败。但事实上,这恰恰体现了历史和语言发展的逻辑与趣味。
例如Minecraft这个词,在现在大多指《我的世界》这款游戏,但在游戏诞生之前,Minecraft往往代指水雷(mine)艇(craft),因此也就不难理解为什么在二战时期这个词的使用频率会如此高了。
而Java在成为一种编程语言之前,一直代表印尼的爪哇岛,作为荷兰殖民帝国的一部分,在19世纪有如此高的使用次数也就不足为奇了。
进一步而言,从Google Ngram中我们能发掘的乐子,也不仅仅局限于整活,因为从上百年文字应用的变迁中,我们也能看到历史有趣的一面。
例如Gay这个词。
Gay在英语中原本只是“愉快的,快乐的”,在1940年前后,才被加入了同性恋的含义。而由于当时恐同、反对同性恋的声音占据主流,致使人们只要使用这个词,就容易被扣上同性恋的帽子,Gay的使用频率,自然就一路走低了。
而从60年代开始,同性恋群体掀起了声势浩大的平权运动,最终“Gay”取代了带有疾病定义的“Homosexual”成为了同性恋的普遍称谓。随后支持和反对同性恋群体之间的激烈交锋,让这个词的使用率一路水涨船高最终超越了过去的所有时期。
同样,我们搜索一个名为Marc Chagall的艺术家,曲线显示他在书籍中被提到的频率逐渐上升,似乎展现出了一位艺术家知名度与地位不断提高的过程。
但当我们把搜索条件,限定于德语典籍后会发现,虽然Marc Chagall整体的频率仍然是增加的,但是在1933年到1945年间出现了明显的低谷。
“德国”“1933-1945年”,我们能从这两个关键词中,读出一段可悲的历史——没错,Marc是一位犹太人,同千千万万的犹太科学家艺术家一样,在希特勒时期的德国,遭到了严厉的禁止和限制。
我们能通过Google Ngram那一个个关键词看到的历史片段,当然不限于此,搜索不同国家、朝代的名称,能感受到王朝的兴衰起落;“饥荒”“瘟疫”“核威胁”似乎已经越来越少地出现在人们的生活中,而“贫穷”“不平等”“抑郁”却在现在越来越多地被提及。
虽然这些结果受到词义变化、拼写变化等因素的影响,在还原历史方面,无法做到绝对精确,但这并不影响我们感受历史独有的那份戏剧性。
真实的历史有时跟游戏里的一样魔幻
3
有趣的是,这些针对Google Ngram的研究,最终孕育出了一门新学科,名为“文化组学”(Culturomics),对应生物学中的“基因组学”。
从古至今,所有被人类记录下的词语大约有5000亿个。其中囊括了政治、经济、文化等各个领域,它们共同组成了人类文明的“基因”。
从这些基因中可以窥见一些变化。在19世纪初,一项新技术平均66年才能走进大众生活,而在1880年至1920年间,则只需27年。而今天,这一趋势仍在不断加速,就像10年前iPhone4S刚刚发布,人们还在畅想着,在未来手机不再只是一个打电话的工具。10年后,它渗透进我们生活的方方面面,我们却早已习以为常。
而20世纪中期的名人,在文字记载中消失的速度是19世纪的两倍。到了现在,一个新梗出现可能几天就会被人们抛在脑后;一个热点话题出现没多久就会被淹没在更多新话题中再无音讯。人们越来越快地接受,也在越来越快地遗忘。
Google Ngram的研究员曾在Ted做过一次演讲
在语言学泰斗索绪尔的定义中,语言的本质是符号系统,Minecraft在过去是水雷艇的符号,现在是《我的世界》的符号,在未来还有可能代表其他含义。符号还是那个符号,但它们变化的过程,隐藏着人类文明宝库的钥匙。
文化是日新月异的,“YYDS”和“废话文学”取代了十年前流行的“神马都是浮云”“给力”。它们的诞生和悄然消失构成了一股裹挟着所有人的时代暗流。我们说过的每一句话,写下的每一个字最终都会刻进文化的DNA里,在遥远的未来成为历史的回声。
热门相关:大奉打更人 你好,少将大人 我有一座恐怖屋 嫁偶天成 豪门蜜爱:独宠天后小萌妻