最近读了两篇文章,感觉很无奈。本也是06年建站,几次关停,(广西运营商到四川火山互联,再到美国一些小服务器商,后来阿里云和腾讯云),很无奈。。。
月光博客https://www.williamlong.info/archives/7430.html
这两天有篇文章很火,刷屏了社交媒体,文章标题叫《中文互联网正在加速崩塌》。文章内容主要讲的是,以前那个年代曾经红火过的中文网站的内容正在消失,中文互联网正在迅速崩塌,移动互联网出现之前的中文互联网内容,已经几乎消失殆尽。
文章的作者举例,如果在百度上搜索“马云”这两个字,把时间设定在1998年到2005年,能搜出来的信息,大概有多少条呢?结果是1条。
那么,事实到底是不是这样呢?下面,我们通过各种具体数据来分析一下。
有个名为“Web Techmology Surveys”的网站,根据全球网站使用的语言,统计了从2013年到2024年这些年来,主要网站页面内容语言使用的历史趋势,从这个表格可以看出,中文网页的数量从2013年的4.3%降低到2024年的1.3%,十年间下降了70%,目前,全球的中文网页数量仅仅略高于印尼语和越南语,而低于波兰语和波斯语。
从CNNIC发布的《中国互联网络发展状况统计报告》的数据上看,从2018年12月到2023年12月,中国的网站数量从544万个下降到388万个,五年时间内下降近30%,这一数据反映了中文网站数量减少的严峻形势。
中国网民规模达10.92亿人,互联网普及率达76.4%,网民数占全球的19%,而中文网页的数量却在10年间下降了70%,中文网站数量在5年间下降了30%,这的确说明,中文内容网站正在迅速减少,并逐步消亡。
Historical yearly trends in the usage statistics of content languages for websites
This report shows the historical trends in the usage of the top content languages since January 2013.
2013 1 Jan | 2014 1 Jan | 2015 1 Jan | 2016 1 Jan | 2017 1 Jan | 2018 1 Jan | 2019 1 Jan | 2020 1 Jan | 2021 1 Jan | 2022 1 Jan | 2023 1 Jan | 2024 1 Jan | 2024 25 May | |
English | 54.9% | 55.4% | 55.6% | 53.9% | 52.3% | 51.2% | 54.0% | 56.8% | 60.4% | 63.6% | 57.7% | 52.2% | 50.1% |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Spanish | 4.6% | 4.5% | 4.7% | 4.8% | 5.0% | 5.1% | 4.9% | 4.6% | 4.0% | 3.6% | 4.5% | 5.5% | 5.8% |
German | 6.5% | 6.0% | 6.0% | 5.8% | 5.4% | 5.6% | 6.0% | 4.1% | 2.4% | 2.0% | 3.9% | 4.7% | 5.3% |
Japanese | 4.5% | 4.9% | 5.0% | 5.0% | 5.7% | 5.5% | 3.4% | 2.9% | 2.1% | 1.9% | 3.2% | 4.3% | 4.8% |
French | 4.6% | 4.0% | 4.0% | 4.1% | 4.0% | 4.1% | 4.0% | 3.3% | 2.6% | 2.5% | 3.9% | 4.3% | 4.3% |
Russian | 5.5% | 6.1% | 5.8% | 6.2% | 6.4% | 6.8% | 6.0% | 7.6% | 8.6% | 7.0% | 5.3% | 4.5% | 4.2% |
Portuguese | 2.3% | 2.3% | 2.4% | 2.6% | 2.6% | 2.6% | 2.9% | 2.5% | 1.3% | 0.7% | 1.8% | 3.1% | 3.5% |
Italian | 1.6% | 1.8% | 1.9% | 2.1% | 2.3% | 2.4% | 2.3% | 1.5% | 0.8% | 0.7% | 1.7% | 2.3% | 2.6% |
Dutch, Flemish | 1.1% | 1.3% | 1.3% | 1.4% | 1.4% | 1.3% | 1.2% | 0.9% | 0.6% | 0.5% | 1.2% | 1.8% | 2.0% |
Turkish | 1.3% | 1.3% | 1.4% | 1.6% | 1.6% | 1.4% | 1.2% | 2.2% | 3.6% | 3.9% | 2.6% | 2.1% | 1.9% |
Polish | 1.7% | 1.7% | 1.7% | 1.9% | 1.7% | 1.7% | 1.7% | 1.3% | 0.6% | 0.5% | 1.2% | 1.6% | 1.8% |
Persian | 0.8% | 0.8% | 0.8% | 1.1% | 1.5% | 1.7% | 2.0% | 2.4% | 3.0% | 3.5% | 2.2% | 1.5% | 1.3% |
Chinese | 4.3% | 3.6% | 2.8% | 2.1% | 2.0% | 2.1% | 1.7% | 1.4% | 1.4% | 1.3% | 1.6% | 1.3% | 1.3% |
Indonesian | 0.4% | 0.5% | 0.4% | 0.5% | 0.5% | 0.4% | 0.3% | 0.5% | 0.7% | 0.8% | 0.6% | 1.1% | 1.2% |
Vietnamese | 0.4% | 0.4% | 0.4% | 0.6% | 0.6% | 0.6% | 0.7% | 1.0% | 1.7% | 1.9% | 1.4% | 1.2% | 1.2% |
Czech | 0.6% | 0.7% | 0.7% | 0.8% | 0.8% | 0.9% | 1.0% | 0.7% | 0.3% | 0.2% | 0.6% | 0.9% | 0.9% |
Korean | 0.3% | 0.4% | 0.6% | 0.7% | 0.9% | 1.0% | 0.9% | 0.8% | 0.6% | 0.5% | 0.7% | 0.8% | 0.8% |
Ukrainian | 0.1% | 0.1% | 0.1% | 0.1% | 0.1% | 0.2% | 0.2% | 0.3% | 0.4% | 0.6% | 0.6% | 0.6% | 0.7% |
Hungarian | 0.4% | 0.3% | 0.3% | 0.4% | 0.4% | 0.5% | 0.5% | 0.4% | 0.2% | 0.1% | 0.3% | 0.5% | 0.6% |
Arabic | 1.1% | 0.9% | 0.8% | 0.8% | 0.8% | 0.7% | 0.6% | 0.8% | 1.1% | 1.2% | 0.9% | 0.6% | 0.6% |
中文网站内容为什么会减少
为什么会出现这种情况,我觉得主要原因有:
平台垄断
中文互联网市场被少数几家大型科技公司所垄断,这些巨头公司通过资本和技术优势,控制了大量的流量和用户资源。平台垄断不仅限制了内容的多样性,还进行内容控制,使得通过常规手段难以访问这些平台的内容,只能通过这些平台专有的软件才能访问,搜素引擎等外部系统无法获取到这些内容,这也使得互联网上的可以直接访问的中文网页数量逐渐减少。
与此同时,小型网站和独立博客在这种竞争中难以为继,许多网站因为流量不足、广告收入减少而被迫关闭。
用户习惯变化与内容生产转型
随着短视频、直播等新兴媒体形式的兴起,用户的内容消费习惯发生了显著变化。越来越多的人选择在抖音、快手等平台上消费内容,而传统的文字和图文形式的网页逐渐被冷落。内容生产者为了适应这一趋势,也纷纷转向短视频等新媒体平台,减少了传统网页内容的创作和发布。
广告收益下降
近年来,互联网广告市场竞争激烈,广告收益普遍下降。许多中文网站依靠广告收入维持运营,但随着广告市场的萎缩,许多网站面临巨大的经济压力。特别是中小型网站,无法承受运营成本,最终选择关闭或减少内容更新。此外,广告主更倾向于投放在大平台和热门应用上,进一步加剧了中小网站的生存困境。
监管加强与内容审查
监管部门对互联网内容的监管和审查力度不断加强,例如网站的备案制度实施等,让许多网站由于无法符合监管要求而被迫关闭或减少内容发布。
带来的影响
互联网上的中文网页数量逐渐减少,虽然这种变化有其复杂的原因,但其影响已经显现,并将在多个方面产生深远的后果。以下是中文网页减少带来的主要影响:
信息获取的难度增加
中文网页数量的减少直接导致了信息来源的减少。用户在寻找特定信息时,可能面临可供参考的网页数量不足的困境,尤其是在一些小众或专业领域。信息的可得性降低,使得用户需要花费更多时间和精力来获取所需资料。这种状况不利于知识的传播和积累,可能影响到教育、科研等领域的效率和效果。
内容多样性的下降
随着中文网页的减少,互联网内容的多样性也在下降。许多小型网站和独立博客因为无法维持运营而关闭,导致一些独特的、非主流的内容逐渐消失。内容的同质化问题进一步加剧,用户能够接触到的信息类型和观点变得更加单一,互联网的开放性和包容性受到削弱。
小型企业和创作者的生存压力
中文网页的减少对小型企业和独立内容创作者带来了生存压力。许多依靠互联网进行业务推广和内容创作的小型企业和个人,由于流量和曝光率的下降,面临收入减少的困境。大平台和热门应用的垄断地位,使得中小型网站难以获得足够的用户和广告支持,生存空间被进一步压缩。
文化多样性的丧失
中文互联网曾是文化交流和多样性展示的重要平台,然而,随着网页数量的减少,许多地方文化、民间艺术、传统知识等内容面临消失的风险。互联网不再是多元文化展示和传承的乐园,文化的单一化倾向可能导致传统文化和少数民族文化的边缘化和遗忘。
学术研究的挑战
学术研究依赖于丰富的资料来源和多样的信息渠道。中文网页的减少对学术研究产生了不利影响,研究人员在进行资料收集和文献综述时,可能面临信息不足的问题。特别是在社会科学和人文研究领域,缺乏多元化的信息来源,会影响研究的深度和广度。
搜索引擎结果的单一化
随着中文网页数量的减少,搜索引擎提供的结果也变得单一化。用户在搜索特定信息时,可能频繁遇到相同或相似的内容,搜索体验下降。这不仅影响用户的使用体验,也可能导致信息茧房效应,使用户接触到的信息更加片面和有限。
结语
总的来说,互联网上中文网页数量的迅速减少是多种因素共同作用的结果,目前来看,这一趋势在短期内无法改变,互联网上中文网页数量的减少带来了诸多影响,从信息获取的难度增加到文化多样性的丧失,到搜索引擎结果的单一化,再到学术研究的挑战,这些影响可能对中文互联网的未来发展产生深远的后果。
鞭牛士:http://www.bianews.com/news/details?id=185963
先问你一个小问题:
如果我们在百度上搜索“马云”这两个字,把时间设定在1998年到2005年,能搜出来的信息,大概有多少条呢?是1亿条,还是1000万条,还是100万条?
我在几个群问过,大家普遍的猜想是,应该是百万或者千万的级别。毕竟,互联网信息如此浩如烟海。马云作为那个时代的风云企业家,在网上留下的痕迹肯定是非常多的。
但实际上能搜出的全部结果如下:
用百度搜索,选定日期范围为“1998年5月22日到2005年5月22日”,含有马云的信息,总共是1条(2024年5月22日数据)。
而仅有的这一条信息,也是虚假的。点进去会发现,文章的发布时间其实是2021年,不属于上面限定的时间段,只是不知怎么回事,它被莫名其妙地搜索出来。
也就是说,如果我们想要了解那一段时间关于马云的经历、报道、人们对他的讨论、他的讲话、公司的发展史等等,我们能得到的有效的原始信息量,是零。
你可能会觉得,这是不是百度的问题啊?如果换必应或谷歌,会不会能搜出来?
我测试过,这两个网站搜出来的有效信息,和百度没有太大区别,比百度略多一些,但也只是个位数。更多的也都是时间紊乱的无效信息,只不过不知道是什么技术原因,被错误地抓取出来。
你可能还会觉得,是不是因为马云属于比较有争议的人,由于某种不可描述的原因,所以他的信息才无法搜到?
但实际上,不仅仅是马云的情况如此,我们去搜马化腾、雷军、任正非等,甚至是罗永浩和芙蓉姐姐这样在那个时候红极一时的网红,或周杰伦、李宇春那样曾经火遍全网的明星,结果也都一样的。如搜雷军的情况,结果是这样的:
在测试过不同网站、不同人名、不同时间段之后,我发现一个令人震惊的现象:
几乎所有在那个年代曾经红火过的中文网站,如网易、搜狐、校园BBS、西祠胡同、凯迪猫眼、天涯论坛、校内网(人人网)、新浪博客、百度贴吧、以及大量的个人网站等,在一定年份之前的信息都已经完全消失不见了,甚至大部分网站是所有年份的信息都消失了。唯一例外的是新浪网,还能找到一些十几年前的信息,但也是极少数的寥寥几条,其他99.9999%以上的内容,全都消失了。
大家都没有意识到一个严重的问题:中文互联网正在迅速崩塌,移动互联网出现之前的中文互联网内容,已经几乎消失殆尽。
我们原以为,互联网是有记忆的,但没有想到,这种记忆,原来是像金鱼一样的记忆。
2
我之所以注意到这个问题,是因为何加盐公众号的主题是研究牛人,所以我需要经常查找他们的资料。
这两年来,我有一个非常明显的感觉:网上能找到的原始资料,每年都以断崖式的速度在锐减。之前还能看到一些原始的报道,后来慢慢没有了;之前还能找到主人公的演讲或者他们写的文章,后来慢慢找不到了;之前还能看到很多采访或对谈的视频,后来慢慢消失了。
似乎有一个吞噬网页的怪兽,它沿着历史的时间线,从过去向着现在吞噬,先是小口小口,然后大口大口,把中文互联网的一切内容,以五年、十年为单位,一口吞掉。
等我们回过神来,会发现,在移动互联网之前曾经存在过的中文互联网的一切,不管是门户网站、机构官方网站、个人网页,还是校园BBS、公众论坛,还是新浪博客、百度贴吧,还是文件、照片、音乐、视频等,都已消失不见。
记得十几年前,我曾经因为换电脑,把一些照片和文章打成一个压缩包,存在某BBS上,几年之后发现,那整个BBS都没有了。我曾经用过hotmail的邮箱,里面有很多很珍贵的邮件,后来全都没有了。我还写过人人网、MySpace,后来全都没有了。
我们曾经以为互联网可以保留一切,但结果是一切都没能保留。
这让我想起刘慈欣《三体》里面提到过的“二向箔”。歌者文明发现了太阳系有智慧生物的存在,出于宇宙先进文明的清除本能,他们向太阳系扔出一张二向箔,于是,整个太阳系以光的速度从三维坍塌成二维,变化成一张酷似梵高“星空”的画片。一切生命、一切文明的痕迹,从此都不复存在。
在互联网上,我们已经处于二向箔的吞噬之中。这种二向箔可以称之为“时间的二向箔”,它吞噬的是时间那一维。
太阳系被歌者文明的二向箔拍扁之后,好歹还留下了一幅《星空》图,而互联网被时间的二向箔吞噬后,只留下一片虚空。
3
为什么会出现这种情况呢?我猜想,主要原因可能是两个:
一是经济原因。
网站的存在,需要服务器、需要带宽、需要机房、需要人员运维,还有很多杂七杂八的监管和维护费用,这些都是成本。如果是有战略价值(例如需要向外展示公司想要展示的信息),或者有短期流量价值(例如还时不时有较多的人上来看),同时公司账上也不差钱,那么还会有动力去维持。
但是如果公司在商业上走了弯路,没钱了,整个网站就会直接死掉。例如人人网就是典型代表。
即便公司还有钱,从运营的角度来看,如果一个网页一年到头都没有几个人来点击,对公司来说,就成了一笔负担,从经济上最理性的方法,就是直接关掉。搜狐、网易早年的内容大量丢失,以及以天涯论坛为代表的BBS集体消亡,都是这个原因。
二是监管原因。
总体而言,互联网信息的监管,是从无到有,从宽到严,从严到更严的过程。以前可以合法存在的内容,后来不符合监管要求了;或者是以前可以灰色存在的内容,后来被定义为黑色了。这些内容都会直接被咔嚓掉。
还有一些是随着时代的变化,舆论的两极分化越来越极端,以前“只道是平常”的内容,在后来的舆论环境中显得非常尖锐、敏感,尽管不违法,但是可能激化矛盾,形成混乱,监管方也有可能会要求处理掉。
除了官方部门之外,愤怒的网友,也时时充当着舆论监管员的角色。他们会翻出十几年前某人无意中说的某句话,揪着不放,把人网暴至“社会性死亡”。
但监管上最重要的影响,还不是监管部门的处理或愤怒网友的攻击,而是它们会造成公司与个人的“自我审查”。
因为谁也不知道,网站上存在的哪一条内容,某人曾说过的哪一句话,会不会在若干年后,给当事人带来灭顶之灾。最好的办法,就是直接把这些潜在的“定时炸弹”全部清除,也就是把网站关掉或者把内容全部删除。
当然,除了上述两个原因之外,还会有其他很多原因。
例如,在南斯拉夫解体之后不久,所有“yu”(南斯拉夫国名Yugoslavia的缩写)这个国际域名之下的网页内容全部消失了。又如,随着版权保护的加强,曾经随处可下载的音乐和电影网站,就都消失了。还有一些机构和个人,纯粹是由于自己的原因,不想在对外展示信息了,就把官网或个人主页关掉等等。
但这些原因都是次要的、局部的。整个互联网内容系统性的、大规模的消失,主要就是由于经济规律和自我审查。
本质上,互联网内容和生命一样,也受进化论的支配。其存在的标准只有一条:以尽可能低的成本争取尽可能多的注意力。
当一个内容能够在互联网上的海量内容中争取到足够多的注意力,而维持这个内容的成本(包括经济成本、监管成本和对抗监管的成本)比其他方式更低时,这个内容就有可能存活在互联网上。只不过它有可能会换一种呈现方式,例如从文字变为图片,从静图变为动图,从动图变为视频,未来可能从二维视频变为三维全息视频等等。承载这个内容的平台也会变迁,从门户网站到BBS,到个人博客,到微博微信,到抖音视频号,到未来可能一个我们不知道什么平台。
当一个内容不能再吸引到足够多的注意力,或者维持这个内容的成本比其他方式更高时,这个内容就会从互联网上消失。以电脑为浏览端、以网页为载体的传统互联网的集体消亡,只不过是这种“信息进化竞争”的必然结果而已。
生物的进化秘诀是“物竞天择,适者生存”,而互联网内容的进化秘诀是“信息竞,注意力择,适者生存”。由于网络效应,这种竞争比自然界还要猛烈万倍,残酷万倍。传统互联网不是单个物种式的灭绝,而是几乎所有内容的整体性灭绝。
每一代新的互联网崛起,旧的互联网必将崩塌,时间二向箔是所有网站、所有内容无可逃避的宿命。
4
如果未来的文明是互联网的文明。我们这一代人,将是没有历史的。因为互联网没有留下我们的痕迹。
“没有历史”,这件事情重要吗?
当然很重要。
我曾经为了写邵亦波的文章,想尽了一切办法,试图找到邵亦波2007年参加《波士堂》节目的原始视频,以及他妻子鲍佳欣以“文爱妈咪”网名在宝宝树社区发了好几年的帖子。最终还是没有找到,只能深深遗憾。
虽然《红尘已忘邵亦波》那篇文章,依然很受大家欢迎,短短一周就有70多万人阅读,2万多人转发,但我十分肯定,我一定还是错过了某些非常重要的信息。如果它们能呈现在那篇文章里,文章质量会更好。
但是我找不到,就只能让文章以不完美的方式呈现。
你可能会觉得:这只是对何加盐这样的研究者和写作者有用,我又不写这样的文章,互联网信息没有就没了,对我又没什么影响。
真的吗?
如果我们已经看不到马云的所有演讲,看不到任正非的以《我的父亲母亲》和《一江春水向东流》为代表的所有文章,看不到段永平在雪球的所有发帖,你会不会觉得有点可惜?
好吧,你说你并不觉得可惜。
那如果我们已经搜不到黄峥的公众号,看不到张一鸣的微博,上不了王兴的饭否,你会不会觉得有点遗憾?
好吧,你说你也并不觉得遗憾。
那如果某一天,知乎如同天涯论坛一样没了,豆瓣就像人人网一样消失,B站好比新浪博客一样已无人问津,你会不会有点心痛?
如果某一天,你喜欢的微博博主所有的微博只显示“作者已设置只展示半年内微博,此微博已不可见”,你常看的公众号只显示“此账号已被屏蔽,内容无法查看”,你在抖音或小红书搜索某些信息,结果显示“作者已清空全部内容”……
甚至,微博、公众号、抖音、小红书,就像曾经存在过的bbs、贴吧、空间、博客一样,全部消亡……
你会不会为此难过哪怕是短短的一分钟?
作为传统互联网的一代人,七零后、八零后已经找不回我们的历史。因为它们已经全部消失了。
新生代也许还能看看朋友圈,但是朋友圈也越来越多“三天可见”,越来越沉默不语。
唯一还在热情发圈的,只剩下一水的营销信息。
未来就连这些营销信息,也终将消亡。
5
如果一件事对我们很重要,而它正在消亡,我们有什么办法挽救它吗?
有人曾作出这样的尝试。美国有一个网站叫做“Internet Archive”,中文译作“互联网档案馆”,保存了很多原始网页。但是我试过,中文的原始网页,保存的很少,而且使用非常麻烦,搜索功能十分原始低效,和没保存差不多。
从技术层面来讲,保存从中国有互联网以来,到移动互联网兴起的十来年时间的所有网页,应该并不难,成本也不高,毕竟比起现在的视频时代,原始互联网的那些图文网页,占的空间几乎可以忽略不计。
问题是,谁来做这件事,有什么动机?
商业机构不会做。因为没有任何商业利益。
政府或许可以像建图书馆、博物馆一样,搞一个能保存所有网页的档案馆。但是政府为什么要花钱费力干这件事?除了保存历史之外,似乎也没有其他理由。再说了,就算是政府做了这件事,对普通网民也没有任何意义,因为这个档案馆肯定也会需要一定的登陆权限,以免信息被滥用。
况且,就算是有机构愿意做这件事,现在也晚了。移动互联网兴起之后,传统互联网的中文内容,几乎已经消失殆尽了。粗略估算,99%以上应该都已经没有了。
从某种意义上,何加盐写的牛人系列文章,也为保存这些牛人们存在过的历史,做出了一点贡献。如果我没有写他们,很多历史就已经在网上找不到了。但毕竟这也不是原始信息,只是经我整合过的二手信息。
现在的中文互联网上,这个世纪前十年发生过的所有重大事件,所有留下过深深痕迹的名人,目前还能找到的信息,几乎已经全是经自媒体编辑过的二手信息,甚至是传过多手,早已面目全非的信息。
关于它们的原始报道没有了,原始视频没有了,原始讲话没有了,原始的网友目击没有了,原始的评论没有了……
再过一些年,这些二手信息和N手信息,也都会消失。就像那些事件从未发生过、那些人从未存在过一样。
我们已经无能为力,只能接受现实。
在未来的互联网时代里,回首看21世纪的前二十年,将是没有历史记录的二十年。
我们是互联网时代消失的一代人。
如果你现在还能看到一些中文互联网的古早信息,那只是夕阳的最后一抹余晖。
如果你明白了它们的转瞬即逝,可能会像临死前的浮士德一样感叹:
你真美啊,请停留一下吧。
但那抹余晖,很快将和你这句感叹一起,被时间的二向箔吞没,陷入虚空。
《三体》中,程心和艾AA还能有幸乘坐唯一的一艘曲率飞船,逃离正在二维化的太阳系。
而我们,连曲率飞船都没有。
逃无可逃。
现在你所看到的、你所创造的几乎所有内容,连同这篇文章,这个平台,终究也会淹没在虚空中。(转载自:何加盐)