数字素养与大模型

一、什么是数字素养

1.1 早期定义

数字素养或许是个伪命题,但认识它总好过忽视它。

数字素养这个词,很长一段时间在我的脑海打转。

自从GPT 4.5的发布让大家真实感受到Scaling Law的瓶颈,我来不及听到AI泡沫何时破灭的论调,却越来越思考大模型到底给生活带来了什么。GPT 4.5被吹捧变得更有"人味儿",而这种人味儿恰恰是我们在讨论数字素养时常常忽略的部分。

在思考何为“人味儿”以前,我们应该先谈谈何为数字素养。

数字素养最初,被定义为一种理解及使用通过电脑显示的各种数字资源及信息的能力,这种早期的理解突出了在接触数字资源时对智力和实践能力的双重要求。

1998年Paul Gilster在《Digital Literacy》一书中具体地将数字素养定义为获取、理解与整合数字信息的能力,具体包括网络搜索、超文本阅读、数字信息批判与整合等技能。

这些早期定义为理解数字素养奠定了基础,使其不仅仅是基本的计算机技能,更包括理解技术如何运作,以及如何安全、负责任地使用数字工具和服务。

尤其是在人工智能快速发展的今天,数字素养的重要性日益凸显,它关乎我们如何适应和利用新技术来提升生活和工作效率。

事实上,微信在2011年被推出,而今天所熟知的抖音,直到2016年才上线。这些如今看似构成我们数字生活基础设施的应用,距离2025年不过是短短数十年。这个时间尺度说明,数字环境的迭代速度远超以往任何技术变革,数字素养在新时代也应拥有更多元的定义。

1.2 新时期的数字素养

多数时候,本篇提到的大模型其实特指的是大语言模型(LLM)。

在近些年,以聊天机器人和推荐算法为代表的智能化应用,快速渗透并重塑我们的信息获取,社交互动乃至思维方式。然而,这种重塑并非普惠且均质的,它深刻地依赖于个体的数字素养。

具备较高数字素养的人,不仅能熟练操作这些“工具”,更能理解其背后的运行逻辑

例如,当意识到推荐算法可能形成的“信息茧房”后,其实我们可以通过刻意的搜索行为和点踩,主动调整画像和寻求多元信息;如果我们学习Prompt Engineering,就能够获得大模型更高质量的输出,并批判性地观察它们。

相反,数字素养较弱的人,则可能仅仅停留在被动接收信息,只做基本交互的层面,也更容易受到算法的操纵,难以辨别虚假信息。从这个角度看,防范电信诈骗的意识和能力,本质上也是数字素养的一种体现。

在读大学期间遇到了疫情时代,那时候几乎所有事项都转移到了线上,日常就变成了用电脑上网课、平板听讲座、填着各种各样的表单、失去了许多活动和出门看世界的机会。

但当把视线拉远,就会发现这场全球性事件对不同国界、不同地域、不同社会经济背景下的人们,几乎是一场彻头彻尾的数字鸿沟。

有些人没有设备和网络,游离在数字生活之外;有些人激情冲浪,慌张转发,陷入信息过载和恐慌;另一些人看到了商业化的契机,推动了所谓的“疫情时代经济”。

数字素养为人们划分出了三个门槛。第一个是入门层面,我们是否拥有电子设备和网络。好在绝大多数,包括此刻的你我,都完全不用为此担心,这只因为我们是幸运的一批人;

第二个是技能层面,我们是否能够有效使用数字“工具”。Chatbot、推荐算法、甚至Excel和PPT,本质上都是一种数字“工具”;

第三个层面是应用与创造层面(突然想到了永恒与创造神印王座Bushi)。这里的概念要尽可能表达严谨一些,我想它代表的是能否利用数字技术改善生活,创造价值,以及批判性地、安全地、负责任地参与数字社会。

关于三道门槛各自存在的问题,本文后面会依次提到。

可以说,进入大模型时代,数字素养的差异会比以往更加突出。这很大程度上来源于大模型不是简单工具,驾驭它们所需的数字素养,已经超越了传统的信息检索和软件操作,融入了更多批判性思维、伦理判断和人机协作的能力。

从GPT面世至今,伴随AI每一次大大小小的飞跃,这种感受是更加明显的。

经历了很多激动和“啊哦”的时间点,也曾抓耳挠腮般通宵调Prompt,感受到大模型内含的力量不在于苛刻追求的benchmark和生成质量,而是对思考和生产方式的重塑,对生产关系所带来的巨大冲击。

观点不妨偏激一些,伴随大模型的崛起,关于人与人之间对数字社会适应能力、驾驭能力的差距,不会弥合或消亡,反而会加速扩张和复杂化。

数字素养不再仅仅关乎我们能否跟上技术的发展,更关乎我们能否在一个人机共生、算法影响逐渐扩大的新时代里,保持个体的主动性,批判性和创造性,避免变成技术的附庸或数字鸿沟下新的“失语者”。

到这里,数字素养仍是一个抽象的概念,我们尽可能让它具象。读完本文初稿以后,汐笺老师问了两个问题:

  1. 如果一个中年人买了一本C++的入门书,就只是笨拙地按照上面的每一行去手敲,你觉得ta数字素养怎么样?

  2. 如果一个人精通几门编程语言,但他连电脑系统都不会重装,你觉得ta数字素养怎么样?

如果拘泥于这两个问题,不同人可能会有不同的看法。

这恰恰说明了数字素养无法被简单的定义,至少不能被轻易的估量。类似的例子还有很多,就像一个从事网络安全的专家,背地里却在接触灰色地带,那这时候,我甚至不愿意讨论ta的数字素养低,只会谈论ta的法律意识淡薄。

不易明确定义,不易估量,但这并不影响我们都能感受到数字素养的客观存在。甚至有时候,数字素养会被错误地归于一个人聪明还是愚笨,学习能力强或者弱。

因而新时期的数字素养之于每个人息息相关,我想这也是探讨「数字素养与大模型」这一命题的原因,或许接下来一切讨论是如此的愚蠢与笨拙,对我个人而言仍收获颇多。

二、数字原住民和数字移民

2.1 代际分野:时间的旅人,数字的异乡人

他们穿越时间,却成为了数字的异乡人,发现之旅并不在于寻找新大陆,而在于拥有新的眼光。

我们生活在一个被数字技术深度塑造的时代,不同代际的人们,与这个时代的关系迥然不同。我们将首先关注向上的代际,讨论数字素养之于老一辈人群。

Marc Prensky较早提出有关数字素养的人群分类概念,伴随互联网成长起来的千禧一代与Z世代(我也是不久以前才理解什么是Z世代),是天生的“数字原住民”。他们自幼沉浸在数字环境中,技术如同空气般自然存在,学习和使用数字工具往往更凭直觉,适应性更强。

与此相对,我的长辈,尤其是那些在数字技术普及前已度过大半生的老年群体,则更像是这个时代的“数字移民”。就像我很难教会我的姥姥习惯使用助听器,那是昂贵且技术属性的产品,这股数字味在它与数字移民之间建立了深深的隔阂。

昨天和朋友义愤填膺地提到:“我们作为数字素养很高的一批人...”他先是下意识滑稽地笑了,紧接着又严肃下来,说:“确实。”

那怎么比较呢,至少我们和前面的代际比,可太高了。

然而,即使是同代际之间依然如此。我们今天可以说:无法熟练使用Excel和PPT的人就是数字素养低;没能力自己重装系统的程序员,数字素养好不到哪去;无法快速上手Coze、影刀之类的低代码工具平台,不擅长使用AI,都是数字素养不足的体现。

最后一条听起来很刻薄,但事实是技术正在快速飞跃,我们没办法用慢涨的工资面对翻了一倍的猪肉价格。

问题在于,数字素养差异带来的鸿沟并非是静态的

随着数字化进程加速,技术进步以越来越快的速度发生,鸿沟只会不断扩大。当社会运行越来越依赖数字化基础,从前可能只是“不方便”的问题,如今可能演变成“被排斥”的困境。

2025年,公交刷卡支付的困难仍是许多老年人面临的日常挑战。我们不能,也不应该假设每一位老人都必须在帮助下才能乘上地铁或飞机。

回想到今年年初在上海临平路,路过一位老阿姨向站岗的工作人员询问:“我想去南站,请问我应该怎么坐地铁。”最后在工作人员不耐烦的拒绝里听出,这样的询问已经发生了太多。

有人会说,地铁站的买票机和墙上会有地铁线路图,机场配备详细的指示路标,志愿者,服务台都客观存在。

但仅仅靠所谓的便利建设就能完全弥合鸿沟吗?对数字移民来说,这就像“打一巴掌给颗枣”般的安慰,是把数字时代的无助归给愚笨的借口。

许多“移民”并非拒绝学习,而是对快速变化的交互方式、功能和不断涌现的新设备感到无所适从,对自己能否独立使用缺乏信心。

可以说在这一点上,年轻人大概率不是合格的老师。

这种适应性的落差,才是数字移民面临的核心困境,进一步说,提升数字素养、理解、应用、批判数字技术的能力才是问题的关键。

我第一次用机场的自助托运机时花了两分钟不到,像个经验丰富的老油条。这种熟悉感除了源于脑海中那些当初被贴条形码的画面,还有各种各样的机器交互记忆,以及数字原住民的自信。

但当我本能地望向前去值机的老人,试图捕捉到他们的反应,总是反复确认,带着说不出的不自信感。

必须承认,中国各年龄段人群的数字素养水平都在逐步提高,社会正在提供更大的数字包容性,包括更多志愿者服务和便利设施建设。

事实是,基建举措难以确保数字移民不会在日益数字化的社会中掉队,老年人的确难以像年轻人那样快速适应新的界面、功能和设备。

感受到过老一辈人对技术的恐惧,对自己学习和使用数字设备能力的缺乏信心。大模型日益融入我们的日常生活以后,反而进一步加剧了这个问题,许多人对人工智能的概念和实际应用几乎一无所知,这种缺乏理解使得他们更难与人工智能互动,也难以理解其对他们生活的潜在影响。

有一天当大模型技术到达他们面前,很可能是以“换脸”、“假视频”、“电诈”等糟糕的形式出现,因而逃避对新技术的理解和学习也绝不是上上策。

过年回家的时候,我的表哥堂哥们,围坐一桌拉着我讨论Deepseek和其它AI大模型,二哥是中医,也是一个走在数字前列的人,正在研究怎么用Deepseek协助诊疗以及学习新的中医技术。

但在另一边,是看着我们发出感叹的七大姑八大姨:“也不知道围在那边聊啥聊的那么热闹。”

我很希望她们能够加入讨论,但在真的被问起“你们聊的Deepseek是什么东西”的时候,我觉得自己的表达是如此匮乏,这比面试官问到一个麻烦的问题更加挣扎。

大模型不是简单的问答机器人,而是作为一种全新的信息生产和交互范式,需要跨越的是比操作技能更深的认知鸿沟。如果说过去的鸿沟主要体现在使用层面,大模型则将鸿沟延伸到了理解和驾驭的层面,甚至关乎到未来社会资源的公平获取。

现有的便利举措渐渐会成为杯水车薪,面对时代变迁带来的必然挑战,现有努力更多是追赶式的,难以完全跟上技术演进的速度。

也许,我们需要促进数字素养的学习,要给到一支鱼竿而非一桶鱼。

数字时代的每一步发展对于今天的老龄社会都是一轮新的冲击,显然希望每一位时间的旅人都能在这个数字时代找到归属感,这需要一种新的眼光,需要以数字素养的普及促进社会公平。

2.2 西西弗斯的石头

诸神为了惩罚西西弗斯,便要求他把一块巨石推上山顶,而由于那巨石太重了,每每未上山顶就又滚下山去,山顶难以逾越,可他比所推的石头更坚强。

数字原住民与数字移民,这其间的沉重不仅源于数字技术本身的复杂性,更在于其背后盘根错节的经济、文化和教育结构差异。弥合鸿沟的努力,往往如同推石上山,每前进一步都异常艰难,且时刻面临着因技术迭代加速,资源分配不均而滚落回原点的风险。

诚然,随着城市化进程,年轻人涌向城市中心,传统乡村的支持网络被削弱,老年群体的数字孤立问题凸显,但这只是冰山一角。

真正的挑战在于,这条鸿沟并非静止而是动态演变。数字技能,数字意识乃至参与数字经济能力的全面差距,影响着不同地域,不同代际人群的命运轨迹。

每一个代际都存在独特的问题,此节本文将讨论向下的代际——更年轻的群体。

读初中时,教室里还是高悬一角的电视机,直到毕业后才逐步替换成全套的多媒体设备,由于所考的高中有着本地最好的教育资源,就少有再体会过地域带来的教育资源差异。

去年冬天的一次闲聊,表哥告诉我他希望从小让孩子使用电脑和平板,并且教会他使用电脑和编程。我那时候先是惊讶,我对他说这真的不像是老家地区人们的认知,紧接着就变成了一种对家乡未来的担忧。

这只是看待社会发展的一个微观注脚,对于山西这个朴实的省份,教育资源的有限更多时候来自家庭环境而非教育环境,在用平板听网课的时候,我知道自己是做题家中的少数,这块“石头”的重量因人而异。

再联想到前段时间刷到物理老师使用Vision Pro上物理课的视频,我想那也是一个非常鲜明的例子。

此刻,数字素养正无可争议地成为下一代的基础能力,而这种能力的培养却正在拉开新的教育差距。

从了解多样的电子设备,掌握基本操作,到理解算法逻辑和具备AI协作意识,这些基础数字技能与资源的获取不平等,几乎注定了经济欠发达地区的下一代,在起跑线上就要面对更陡峭的上坡路。

回想儿时,在XP系统上玩《金山打字通》或许是我数字素养的懵懂起源。但直到今天,与居住在城市中心的同龄人相比,不发达地区长大的孩子从小接触电脑、各种智能设备和基本人工智能概念的机会仍然少得多。

尤其是一些“小孩不能玩手机电脑,伤眼睛、毁注意力”的观念,在智能设备无处不在的今天,反而可能异化为一种新的数字剥夺,让孩童时期接触和学习这些未来生存必备技能的门槛不降反升。

本篇很难对此深入讨论,这显然是个足够复杂的社会问题,我只能忐忑地抛出一点暴论,那就是“寒门难出贵子”的论调很可能比过往更加接近现状。

几个月前在商场逛讯飞看学习机,看到学习机和中小学的深绑合作版图上,江浙沪地区名列前茅,其他省份寥寥无几。猜想可能很快,甚至已经,从小学开始就将提供人工智能相关课程。

我不知道未来“努力就会成功”的故事如何讲述,以及部分人如何在数字素养差距极大的情况下拥有更好的就业环境。我知道的是在“燕雀安知鸿鹄之志哉”里,燕雀与鸿鹄至少共享了飞翔的本能与天空,我们的社会也的确正努力避免扇动“数字翅膀”的机会被结构性限制,这算是一个好消息。

请努力移除那块阻止人们平等向上攀登的巨石,而非仅仅赞美无望中依然奋力推石的个体。

2.3 海德格尔的便捷座架

海德格尔所言的“座架”,粗略地指代现代技术将世界万物强行纳入一种可计算、可支配、以效率为圭臬(guī niè,标准的意思)的“解蔽”框架,追求将一切存在转化为随时可用的“持存物”。

代际是数字素养讨论的重要分水岭,那站在时间维度以外的技术角度,技术同数字素养是如何协同演进的?数字原住民和移民是在什么节点产生区分的?

前几天和做研发的朋友聊到用ZFB“碰一碰”的事情,我说我觉得丢人,在前三次使用的时候都很局促。

调整手机位置不灵,拆掉手机壳不灵,反复失败后无奈转向熟悉的二维码扫描……与其说是操作失败,不如说是一种数字素养在特定场景下的失灵感,令人颇感狼狈。

从这个角度讲,“碰一碰”就是便捷座架的微型缩影,把支付操作定义成极致便捷的标准化交互。

当越来越多环节被嵌入这样的便捷座架,技术就迎来新一轮解放,更多便利被释放,而无法迁移进新的交互框架的人们,就被座架绊倒。

便捷座架的运作逻辑,在于将复杂的世界简化为可控的变量,将行为标准化为统一的指令。它许诺效率,却往往以牺牲兼容性和韧性为代价。

当我们将越来越多的交互行为,从购物支付到身份验证,都托付给这类追求极致简化的座架时,我们就进一步提升了数字素养的门槛,因为它逐渐要求人人都能够理解并使用一项新的技术。

在今天,没有智能手机寸步难行,智能手机和5G网络就是一道数字素养的门槛。

不可否认,我们仍然应当追求发展,追求接入新的座架,只是不希望以制造新的数字移民为代价。被绊倒的人并非拒绝进步,只是在占据领先的单一技术尺度衡量下,其固有的生活经验与互动方式被判定为低效。

另一位朋友跟我分享过类似的问题,因为苹果电源键双击出现的地铁卡总是不灵敏,后来她就放弃了nfc转去扫码。这是一位中科院的朋友,提到这点只想说明:掌握特定NFC应用的能力,与我们通常理解的代际差异或教育水平没有过硬关联,它更像是一种需要特定诀窍或经验积累的隐性知识。

许多看似傻瓜化的技术应用,其顺畅使用的前提,却依赖于用户并不天然具备,也未被充分告知的特定知识

知道,就能用好,不知道,就要尴尬。

二维码支付与“碰一碰”的差异在于,二维码之所以能在国内如此普及,恰恰在于其相对透明和高容错率。

对准、扫描、确认,这个流程虽然做不到一触即达,但逻辑清晰,操作区域明确,用户的心智模型与实际操作能较好匹配。

相较于虽然步骤稍多,但已形成广泛用户习惯且容错率更高的二维码支付,“碰一碰”在当前阶段的体验优势,还不够显而易见,用户不知道那个精确的“甜蜜点”在哪里,系统本身也并未提供足够的引导或容错空间。

有这样的场景在我脑中闪过:老一辈看到优惠立减的牌子,拿出手机尝试碰半天无果,这时候后面正排着焦急的队伍,售卖员出来询问“是不是没开通啊,要不扫码吧?”

窘迫、挫败感与被公开审视的社交压力,远非一句“技术需要适应”可以轻轻带过,这正是便捷座架的冷酷之处。

这个接入新的座架的过程,恰恰可能构成一道无形的“数字鸿沟”,将一部分用户挡在便捷之外,甚至带来额外的社交压力。

在数字素养的门槛被拉高的同时,也向个体提出新的要求,要求个体保持处理复杂情况,应对非标准情境的能力,保持对于技术背后权力结构和社会影响的批判性思考。

现在回答本节开头提到的问题,在技术维度上,数字素养变迁的关键因素在于技术在应用层面的落地;但技术和数字素养的泛化速度是不同的,大模型作为技术的一次重大飞跃,在短短几年间就快速冲击了现有的众多生产关系,向生产者提出了更高的数字素养要求,却忽略了数字素养本身的滞后性和普及难度。

然问题与机遇并存,座架交替之时,或许也是依靠认知差异寻找更多机会的窗口期,这一点的对错只有依靠后验。

三、在大模型时代

3.1 上下楼梯靠右行

“上下楼梯靠右行”,“过马路,向左看”,“How are you? I'm fine, thank you......”

在大模型时代,我们与技术的关系,正从单向的学习如何使用工具,转为双向、更复杂的协作关系。

我想以最近很火的Vibe Coding为例来阐释这句话的含义。

在做独立开发的一段时间,我常常在用户和开发者之间反复横跳。

的确,当需要一个微信读书的笔记整理工具,只需要一个下午就可以编写,功能完全跟随个人需求,但大模型降低所谓语法要求的同时,同时也带来了新的门槛。

先普及这个概念:氛围编程。简单地说,我们把依赖直觉、模糊指令或与AI协作的编程方式称为“Vibe Coding”。

在过去,我们高度依赖编程语法,不啃书不敲键盘,就无法学会一门编程语言。但现在,“人人都是程序员”又或者“一句话创造一个XXX”,这种充满了营销的和传播焦虑的有毒论调被鼓吹。

如果你问我那是不是真的,首先我想说,大可一试。

至少在今天,大模型远没有达到这个能力,但它确确实实地降低了一定的技术门槛,同时也在更高维度上设立了新的、更隐蔽的门槛。

那种“先想清楚,然后借助AI大部分都能做,最后通过尝试发现原本以为不能的也能实现”的体验,正是这种新模式的体现。

编程强调的不再是按部就班,而是探索、试错、迭代和对过程的掌控。

熟练掌握语法不再是唯一标准,思维逻辑清晰严谨,对用户需求具有深刻洞察以及拥有与AI有效协作的耐心和技巧,这些“软技能”,反而成为了更关键也更难跨越的门槛。

这大概类似于,当你成为老板,难题不再是业务技能本身,而是如何管理和与员工协作,以处理更复杂的业务。

能力越大,责任也越大,工具越先进,所要求的数字素养也在相应抬高。

举一个经典的场景,就是商业智能BI领域的数据分析。

多数不算复杂的数据查询指令,现在其实并不必掌握SQL语法和配置,只需保持业务洞察,能够清晰表述即可。

本质上,这是人类直觉与机器逻辑的融合,既使用编程思维构建问题框架,又保留大白话的易读性,可惜目前这样的能力既不易量化,也不易总结完备的方法论。

当自然语言编程的新范式被定义,编程看起来就像是一个张嘴不断提出需求的过程,此时体现出的,就变成了编程者的数字素养,变成了人与大模型的对话情商。

仍要强调,这并不是对大模型的狂热吹捧,大模型的能力与局限性是并存的。

能够分分钟写出上百行代码的大模型,有时却连简单的数据计算和小幅修改都很难做到(骂街)。此外还存在许多不值得解释的巧合,比如有次我只是训斥了大模型一句,两个小时没修好的Bug突然就修好了。

它偶尔能惊艳你,偶尔又给你的期待泼上一盆冷水。

到这里,本节一直在强调协作关系,那又为什么说双向关系呢?

换一个视角看,自然语言编程流行以后,人们对编程语言的选择未必是主动的,也可能反过来被影响。

过去,人们选择用什么编程框架和语言编写,与语言的性能和易读易写都具备足够强的关联,但现在,大模型擅长写什么语言、出错少、实现容易,我们就可能倾向于选择什么语言。

设想你从未接触过网页开发,当你询问大模型我要如何开发一个网页,或是直接使用V0等一众全栈式开发平台,很快你就会被大模型“种草”它们所推荐或使用的开发语言。

这种趋势很可能带来“滚雪球”效应,大量所推荐语言写成的网页成为了新的语料,使得后续训练出的大模型对该种编程语言更加擅长,久而久之,语言的地位也水涨船高。

此时即使存在更好的代替语言,只要旧语言存在的时间够久,语料质量够高,大模型擅长,它就可能在编程语言中占据一席之地。

这其中是非曲直,难以论说。

在年初的时候我写过一篇《了解大模型的能力边界》,到现在有个观点我仍然认同。

我们的数字素养确是被带入了新的认知坐标系:其中X轴是机器可理解的逻辑框架,Y轴是人类特有的模糊表达,Z轴则是虚实交融的协作空间。

当我问大模型,我的机器学习模型还有什么样的优化方向,希望得到的是灵感,并不是在给出的答案中做选择。

潜移默化间,每次数字交互都在打磨我们的数字素养,重构我们的认知结构。很难说究竟是我们训练了大模型,还是大模型在潜移默化中已然打破我们“上下楼梯靠右行”的固有认知。

这是一场人与大模型的相互“驯化”,此刻我们手中的工具也具有了一定的说服力,我们随时会从工具的主导者变成协作者,学习者。

最终,我们需要判断这个协作和双向的边界究竟在哪里,这是笔者无法回答的问题,每个人都可能有自己的答案。

3.2 赫拉克利特的河流与火焰

思考如同永不停息的河流,创造则是转化所有的火焰。"人不能两次踏入同一条河流",每一刻的思考都孕育着新的创造可能。

讨论过了人与数字工具的新型协作关系,本节想要聚焦更为根本的问题:在与大模型深度交互的时代,如何定义和保持我们的数字素养与能动认知。

值得一提,从2025的开年到现在,大模型的应用落地出现了一些好兆头。

无论是通用智能代理Manus,各家争相推出的DeepResearch,还是最近爆火的GPT-4o吉力卜风和即梦3.0,当下新的技术座架正在不断出现并等待接入。

而这波风潮中让所有人感知最深的,应当是年初的Deepseek R1。

推出至今,Deepseek R1在中文语境下的思考链仍然称得上是独一档的优秀,也催生了所谓的DeepClaude等一众混合推理模型,被当作“感情导师”、“算命大师”、“量子学家”......

不可否认,对于善用者而言,大模型已成为一件强大的生产力工具。

可作为AI工具的受益者,当有一天我越来越依赖这份生产力后,我“焦绿”了。当AI可以写出像样的文章、生成精美的图片,我的价值是否被剥夺了?

有天在即刻上调侃我是AI的时候,我是认真的觉得自己犯了“AI病”,发现自己时而讲话、组织文字甚至是思考都有一股AI味儿,甚至于拿着备忘录的手写内容去检测,却被贴上了AIGC生成的标签。

我不知道如何表达,这种担忧的认真。

AI几乎正夺取使用者作为人类思考和写作的独特性,这是一种警示,如果个体缺乏数字素养,就可能在不知不觉中,从工具的使用者沦为思维的模仿者。

而那些被影响的思考和表达,就成了人机深度交互时代下,认知边界模糊化的缩影。

或许正是在此刻,数字素养表达了新的内涵:不仅是和工具一同协作的能力,也有与其相处的艺术,是一种思维方式,一种在数字世界中游刃有余的能力。

面对大模型这个“数字朋友”,我们需要知道如何提问,如何引导得到需要的答案,如何判断回答是否可靠,甚至于如何不被其思维所影响。

可以说,一个人和AI对话的能力,并不是纯粹的Prompt Engineering,也是数字素养的体现。

此前自己从继刚老师那里习得了很多提示词知识,也写过一篇《好文分享:数字生命卡兹克采访李继刚》。

每当觉得提示词技巧掌握足够的时候,就有人提醒我们:“Read in, Prompt out.”

多读书,就会写出更好的Prompt。

在我看来,写好Prompt既需要一定的编程思维,也需要感性表达的思维。我们需要在人类语言和机器语言中相互借鉴,感受它们如何被融合。

机器语言的“If-else”和人类的“请你...”、“做得好”都有着独特的价值,好的提示词是理性与感性,文学与科技的结合。

我想这样形容这件事,提示工程的探索是数字素养提升的一本练习册,似乎晦涩难懂,充满玄学,却引出一条从局部最优解走向下一个最优解的最好指南。

过去,能读会写是区分文盲的标志。而今天,能够理解并利用数字工具,在信息流中辨别真伪,保护自己的数字隐私,维持独立思考,这些都成为了新时代的识字标准。

换句话说,大模型时代的数字素养将成为人类与AI共存的关键,它是生命力一方新的体现,是我们在数字时代保持鲜活的能力。

这不仅关乎如何使用AI,更关乎我们作为“活人”,如何保持自身的独特性和创造力,就像保护生命力那样,有意识地培养和保护自身的数字素养,这绝非简单地追逐技术风潮。

大模型正在变得愈发智能,AGI也许就在若干年之后,但来自硅基的声音,永远带不给作为碳基生命的我们足够的信任和亲和力。

想到这一点后,我要做些什么,也许称之为“保持思考,继续创造。”

四、新的量规与光谱

4.1 一些烦恼

自从身份标签里多了“AI公司Boss”这一项,工作日常就充满了某种甜蜜的烦恼。员工7x24小时在线,按工发资,作为人类管理者的我就更加急于拥有领导好它们的数字素养。

在招收大模型员工时,每个员工都自带简历,那就是它的发布评分。

面试固然重要,但我们现在讲的是筛选简历。作为AI Boss我可以随意辞退和更换员工,无须关注模型的未来潜力,只需要着重了解这位员工当下的能力。

工业届的基准测试(Benchmark)就正好成为了我的笔测题库,也就是新发布的大模型在发布时所提到的测试评分,它们在评估大型语言模型的能力方面发挥着至关重要的作用。

比如MMLU覆盖人文社科等 57 个学科,难度从小学水平到高级专业水平不等,测试大模型的世界知识和问题解决能力;HumanEval则通过评估所生成代码的功能正确性来评估大模型编程能力,此外还有许多这里不再细举。

坦白说,在深度求索推出Deepseek R1以前,我对其过往模型一直有“评分没输过,体验没赢过”的吐槽。

这能说吗,算了这能说。

Deepseek系列已经足具性价比,但过往的确有太多国产大模型,发布就带着光鲜亮丽的Title,投入实用却一用一个不吱声儿。

好在,铺天盖地的宣传不能带来长久的留存,真正的创新也并不惧怕一时批评,一些国产模型开始泯然众人矣,一些低调却愈发有实力。

不管怎么说,正如智商测试或升学考试用于衡量人类认知表现一样,大模型基准测试提供了一种量化评估这些模型能力的方法,参考性与局限性并存。

现在,当我们把目光从评估大模型转向评估人类自身的数字素养,可以同样类比大模型的基准测试。

我们不能用一把尺子丈量整个世界,评估数字素养不能仅仅依赖单一指标,而应是一个多维的能力矩阵。

过去,数字素养为了衡量人类在数字时代的适应水平,始终在经历演变。

在欧盟数字胜任力DigComp框架中,公民数字胜任力被划分为信息处理、内容创作、沟通协作、安全意识和问题解决五大维度,近几年,该框架不断迭代并加入有关人工智能的评估标准。

在DigComp2.2版本的259个实例中,AI搜索、聊天机器人等36个实例都明确使用了AI的概念。细究其内容,就会发现大模型的评估标准与人类数字素养评估之间存在互相映射的关系。

我们关注模型的幻觉问题、隐含偏见、生成内容的可解释性,同样也在审视自身与大模型互动时的判断力、批判思维和伦理意识。

由于大模型的核心能力在于理解和生成人类语言,并模拟人类的知识结构和推理过程,这就使得它们与数字素养的传统定义,特别是涉及信息获取、处理和表达的部分产生了前所未有的直接关联。

当一个工具能够模仿甚至在某些方面超越人类在这些领域的部分表现,我们衡量自身能力的标尺,必然要随之调整。在可预见的未来,精准衡量和持续提升个人数字素养的需求,不仅不会消失,反而会因为大模型的普及而变得更加复杂和关键。

二十年前“Excel产品经理”的说法,在今天俨然变成了“AI产品经理”。

那么过几年呢?AI能力或许成为人均数字素养的一部分,产品经理会迎来新的前缀,其代表着更高的数字素养理解和数字工具的协作能力,作为标尺加以划分。

大模型时代也许只是数字时代中的一段浪潮,我们都是身处其中的弄潮儿。

现在,社会需要新的“量规”来测度这个时代的大模型能力水位,需要更广阔的“光谱”来理解数字素养构成的多元维度。这关乎个体如何提升竞争力,如何健康且有效地拥抱这场技术变革。

4.2 哥白尼之问

若世人皆说太阳绕地转,那地球是否真的一定静止?

在使用AI搜索替代传统搜索引擎一段时间后,我发现自己部分地折返回了传统搜索。

这不是技术倒退,而是因为传统搜索的直接性和可验证性给了我更多的“数字安全感”,让我发现,大模型带来的最大困扰不是能力局限,而是难以确定的信任边界。

于是我想聚焦于新的量规上那个最关键,也最需要个体主观能动性的部分:信息素养。

在过去,信息素养的重点更多地放在如何找到信息上,传统搜索引擎的普及基本解决了这个问题。但大模型的出现,让信息的获取变得前所未有的容易,有时候,我只需要学习如何提出问题。

如上一章里提到的,新的“座架”常常带来新的矛盾。

大模型抽风的时候,几乎是一脸自信地胡说八道。那些看似流畅又专业,实则充满事实错误、过时信息、甚至完全捏造内容的答案,我们也称之为幻觉。

这是天然的中转带来的不安全感,我们直接接触的信源本身可能就已经是多手,经过大模型加工以后的可信度变得更低。

比幻觉更难评的,是所谓的AI味儿识别,区分高质量的AIGC内容与人类创作正变得越来越困难。

半年前做过一个图片判别测试,其实就是判断一张图是否由AI生成,我只判断对了70%。

半年过去,我现在有理由相信这个比例只会变得更低。如果你对于大模型了解更多的话,事实上有非常多的细节有助于判断,但识别能力是其次,保持这种识别意识才最重要。

数字素养正不断要求我们具备足够的信息素养,信息素养首先就要我们保持充分的质疑和批判。

过去学习RAG的相似性匹配时,第一个接触到的例子是GPT3.5给我的,它告诉我小狗和小猫的向量在欧氏空间中拥有更高的余弦相似度,而苹果和砖头却不然。

甚至那时候有人以此为问题去评价模型能力的强弱,那就是对两个看似毫无关联的事物建立关联。

正如不论我们发送多么抽象的观点给Deepseek,让其理解我们的观点,它都能在欧氏空间中准确寻索,为我们找到无比合理又看起来逻辑严谨的解释,这是我长期觉得恐怖的一点。

大模型亿万参数模糊了许多现象间的边界,于是假更真,真也更假。模型作为现实世界知识的投影,并非完全真实,并非清晰客观,员工忽悠老板,怎么没可能呢。

往好了想,这或许意味着一种宽容性的提升,告诉我们事物不是非黑即白,非一即零。

更多时候,我们需要一个明确的价值判断与观点,对大模型生成的内容也好,对推荐算法给到的信息茧房也好,时而破之,多质疑,多批判,不被牵着鼻子走。

对待大模型,知其长,亦知其短,用其长,避其短,此时数字素养就具象成了理性的技术应用态度。

最近工作的时候,遇到了大模型很多离谱的时刻,这以后我总结数字素养中关于大模型很重要的一点,就是不被大模型的花言巧语轻易迷惑,也不因其偶尔的失误而全盘否定其价值。

这个信任边界直到我数次认为自己足够了解以后,仍然有不断调整的空间。

数字素养教给我们,大模型给予的从来不是终极答案,而是思考的起点。

4.3 我在哪

大模型的浪潮正以前所未有的力量,冲刷着熟悉的数字海岸线,塑造着新的地貌。在这个过程中,所有的度量体系都不断演进和相互参照。它们共同描绘出这个时代所需的智能与能力图景。 —— Gemini 2.5 Pro

到这里,我开始对最初写作的东西感到印象模糊,看了看字数不知不觉上万,原来我的窗口就这点token量。

“数字素养与大模型”的话题太过宽泛,本篇能够承载的不过是表面涟漪。

想到和朋友聊天的过程中,常常一起预测下一段时间最容易被替代的工作。讨论的结果太吸引争议,于是选择一个字也不提,大家唯一欣然确定的共识是:“嗯,AI这玩意太XX了,我一个数据产品经理,能被这玩意替代我是怎么都不信的”,以及,“用不好Excel的产品经理不配谈数字素养。”

关于数字素养的讨论,此前我一直有一些担忧。

我们总是讲拥抱数字时代,但拥抱的前提,是重新审视我们在时代中所处的位置。从诺基亚到智能手机时代的跃迁中,我们获得了空前的连接可能性,却仍然感觉人与人的联结感被削弱。

如今的AI崛起,正如当年智能手机的出现一样,挑战既有的数字素养认知,重塑个体与技术的关系边界。会不会在未来,文学甚至情感能够被数以亿万计的参数所定义,被降维成数学问题。

《胶囊计划》中有一集,讲未来有一套全方位的量化系统,能够匹配出这个世界上最适合你的伴侣名单并打分,最后计算出你要如何遇到对方和产生情愫。

虽然这样的乌托邦多少有些夸张,但朋友半开玩笑:“我觉得以后很多人有AI陪伴就够了,也不用担心养老,机器人现在发展得挺好,”这确是肉眼可见的可能。

所以话说回来,与其焦虑会不会被AI替代,不如思考如何在这个数字时代重新重视自我价值。当算法可以模拟创造力,机器可以生成看似深刻的内容,我们需要知道个体独特的价值在哪里。

汐笺写的《再见绘梨》里有一个观点我很感触,那就是人都有一条自己的人生曲线,有些人运气好,有些人运气差,曲线虽各不相同,却是一种活着的实感。

当你感到痛苦,就意味着你已深处命运之中,当你歌颂爱情,就比大多数人活得真切。

本文所定义的数字素养超越了工具使用的范畴,它要求每个人理解技术的本质与边界,明智地选择何时借力,何时独立。

数字素养的定义,是要你思考地活着,**带些“愚笨”地活着。**寻找技术与人文间的平衡点,既能借助AI拓展认知边界,又不被其算法逻辑所同化。

这是我为数不多,却越来越多批判“理性”的绝对价值的时刻,否认“技术”的绝对优先,因为感性的价值从来都不该被忽视。

用一个躲避困难的比喻:当下避开的墙,未来可能会化作无数次遇到的电线杆和绊脚石。理性有时只是我们对可见成本的恐惧,而忽视了那些无法量化的长远价值。

在感到痛苦或喜悦时,知道自己原来如此真切地存在,知道人类应当拥有爱与幻想,这是与生俱来的天赋,也是区别于机器的根本。

无论怎样的数字素养,都换不来人类的情感深度与创造高度。

过去已不可及,未来犹未可追。立足当下,我们或许可以这样描绘自己所处的时代:未来已至,但仍在成形。

在数字与人文的交汇处,我们会找到自己的位置。

后记:闲谈

在字节待的这段时间,总是有很多抓马的讨论,正经的或是不正经的,在这里的松弛感一部分来自认真产出,一部分来自一桌PM金句频发的唠嗑。

很重要的一点是,认识的人在工作之外都是非常鲜活的人类。

这个词像是在形容食材,形容寿司。像一位朋友,他不用“真人”,总是下意识地讲“活人”。

是啊,有些真人在眼前,你却能明显感受到逐渐流失的生气,那“真人”和“活人”的确实是两个概念。

我也始终认为,生气是一种生命力,是持续消耗且很难恢复的不可再生资源,不等同于暂停上班一段时间消除班味,生命力不只是体力、脑力,也是种气质,灵魂的、语言的气质。

为了保护自己的生命力,我还是纵容自己表达,纵容思考,纵容做梦。

有一个时刻突然就对“身体是革命的本钱”产生了多一点认同,生命力是创造价值的基础,我们先拥有了生命力,然后在这个物质世界创造和改变。

痛也好,撞南墙也罢,我们需要更多“活着”的感受。