邱泽奇:文科智能的未来图景-凯发k8一触即发

| |

邱泽奇:文科智能的未来图景

作者简介

邱泽奇,北京大学中国社会与发展研究中心主任,社会学系教授、博导,数字治理研究中心主任,教育部“长江学者奖励计划”特聘教授,北京大学博雅特聘教授。研究方向为数字社会发展与治理、技术应用与社会变迁。主要著作有《重构关系:数字社交的本质》、《数据要素五论:信息、权属、价值、安全、交易》(合著)、《技术与组织:学科脉络与文献》(主编)等。

摘要

生成式人工智能的发布标志着人工智能迈入社会应用阶段,引发各领域对人工智能影响的讨论。在学术领域,人工智能带来的影响远大于科学革命中计量技术带来的震动,其中,对文科的影响尤其具有颠覆性。在学术发展的历史里,文科是整体性学术在科学革命里的剩余,其中人文学科还带着整体性学术的特征。在技术发展的脉络里,人工智能不是一个具有充分共识的概念,可对人工智能的应用均指向对人类思维与行动能力的延展和替代。人工智能对学术领域的影响产生了学术智能,其中理科智能形成了一些可资借鉴的路径,文科智能将会与理科智能殊途同归,文科的未来终将通过人机互生的知识创新与积累而成为人类日常需求的知识源。

2022年11月30日,chatgpt的发布标志着人工智能从实验室迈入社会应用。一年多以来,人工智能话题的热度持续不减。近期,gpts的发布,进一步延续了人工智能话题的热度。围绕人工智能与人类未来,从日常支持、工作替代,到人类替代;从社会大众、专家精英到国际社会,人们热议人工智能给人类社会带来的无限可能。其中,既有对人工智能影响的积极期待,如改善人类健康、提高残障人士的生活质量、增进人类福祉等;也有对人工智能负面影响的想象,如替代人类工作,让大量劳动力失去工作岗位,包括对人类的奴役、替代,甚至消灭等。

在丰富的想象中,处理人工智能与人类关系的人工智能伦理成为各国政府和社会关注的重点议题。2023年11月1日,首届人工智能安全峰会在英国伦敦布莱奇利庄园举行,标志着对人工智能负面影响的警惕已经进入各国政府的视野。

在保证人类安全的前提下,应用人工智能造福人类社会也成为各国努力和竞争的主要场域。其中,知识创新与积累是一个小众却又对人类影响深远的领域。事实上,人工智能对学术的影响快速且深入,业已形成了一个通用术语“理科智能”(ai for science)。按照人们当下对学术的理解,学术包含自然科学、社会科学和人文学科。如果不那么精准和复杂地进行分类,则可以简化为文科和理科。与16世纪中叶科学革命初期的格局类似,人工智能在学术领域应用(学术智能,ai for academia)的切入点主要集中在理科(science)。对于文科智能,专家们虽然进行了许多努力(lazer et al., 2009; lazer et al., 2020),当下却还没有找准突破口,还没有像理科智能那样形成可以闭环的工作流程或场景逻辑,更没有形成可以上线gpts的应用。

本文从学术发展的历史和人工智能技术的脉络出发,试图探讨人工智能与文科未来。自从人类把对自然与社会的解释权从诸神手中夺过来、用知识替代神谕以来,学术发展始终呈现为“素材-方法-理论”之间的互动与促进。其中,触发三要素形成新互动模式的始终是技术演进(邱泽奇,2023)。如果把人工智能理解为新一轮的技术变革,便意味着文科三要素面临互动模式的新发展。新的互动模式会怎样呈现呢?对该问题的回答可以有两条研究路径。一是运用事实进行归纳和提炼,获得人工智能与文科未来的事实逻辑。只是,开启这一路径的前提是有事实,即需要在实践层次获得人工智能与文科发展的诸多场景。遗憾的是,理科智能在当下已有若干场景,而文科智能还没有。如此,我们只能选择另一条路径——借鉴已有的事实,在概念层次进行探讨。本文采用的是第二条研究路径。为了在概念层次阐述人工智能与文科未来,我们还需要回答几个基本问题,如什么是文科?什么是人工智能?人工智能与文科未来有什么关系?后面的讨论将分为三个部分:从学术发展的历史中论证文科是人类知识创新与积累的剩余领域;从技术脉络的演进里阐述人工智能是人类智力的延展和替代;运用理科智能实践阐述文科未来是文科智能,而文科智能的本质也是人机互生。

学术发展史中的文科

文科通常是人文学科和社会科学的总称。人文学科与社会科学的分野不是从来如此。夫子讲“六艺”,讲的是人类的知识和能力,并没有区分人文和社科,也没有区分文科和理科。区分人文和社科是科学革命之后的现象。当下,大多数人的第一个共识是,把以探索人类精神为基本目标的学科称为人文学科。人们不以“科学”指称人文类的学术研究,是因为在对人文的探索中还有许多不满足科学逻辑的部分,譬如文学与艺术对人类精神的探索很难用科学逻辑进行归纳和解释。当然,人文探索是否需要满足科学逻辑要另当别论,因为这也是一个极有争议的议题。大多数人的第二个共识是把以探索社会规律为目标的学科称为社会科学。人们以科学指称对社会现象的学术探索,是因为在对社会的探索中均试图用科学逻辑对社会现象进行归纳和解释。毋庸讳言,社会科学对社会现象的归纳和解释与自然科学对自然现象的归纳和解释还有很大区别。可是,社会科学家们总是试图理解社会现象发生发展的规律,也尽量让对社会现象的归纳和解释符合严谨的科学逻辑,在这一点上,他们与自然科学家们对自然现象归纳和解释的努力是一致的。

在人工智能运用于科学研究之前,依据科学探索三要素(素材、方法、理论)组合的发展,文科大致经历过两个相互承接却又有本质差异的阶段,即学术阶段和学科阶段(邱泽奇,2023)。进入数字时代以来,文科发展进入第三个阶段,即智能阶段。人工智能是这个阶段出现的现象,也是在这个阶段构成了与文科的关系。回溯学术的历史,在文科发展的每个阶段,技术进步始终是撬动文科(准确地说是撬动整个学术)变革的力量。要么带来素材的丰富,要么带来方法的革新,要么对既有理论提出挑战。无论是素材丰富还是方法创新,都会推动人类观念的变革,进而带来观察事物视角或理论的革故鼎新。换句话说,三要素互动与促进带来的是人类对人文精神与社会规律认知的创新与积累。

在人类发展的早期,用于知识创新与积累的素材数量和类型都相对有限,只有文本、图像、实物、言语、音乐、舞蹈、仪式等。不过,人们把想象拓展和比较分析等方法运用于有限素材,还是发展出了对自然与社会的认知方法,形成了认识自然与社会的知识创新与积累模式,也就是人们常说的学术(academia)。

学术是人类知识创新与积累的第一个阶段,也是文科发展的第一个阶段,在本质上是人类理性与神谕分离的过程,形成的是人类对自然与社会现象的整体性认知。必须指出的是,整体性知识是一部分人个性化地对自然和社会现象进行非计量刻画与阐释的产物。我们说的文科,在那时还是整体性知识的一部分。从神谕到学术的发展,其价值和意义不只在于当下理解的知识创新与积累,更重要的是让人类在认知上摆脱了对诸神的依附,用人类理性建构起面向自然现象与社会现象的知识体系。与此同时,人类也因一部分人对创造与积累知识的贡献而将他们塑造成知识精英(传统中国人常说的“读书人”),将他们奉为圣贤,并将对自然现象与社会现象的解释权让渡给他们。古希腊的“三圣”、中国春秋战国时期的诸子百家莫不是如此。

在以整体性阐释为特征的学术发展中,人们逐渐发现,采用新的方法或技术工具可以获得同一个对象或现象的不同素材,改变对对象或现象的认知。例如,1543年,维萨里出版了《人体构造》(de humani corporis fabrica),他用解剖方法观察人体结构,获得了之前不曾了解的人体构成内容,让诸神子民身体的构造不再神秘。又如,哥白尼的“日心说”提出之后,第谷、伽利略、开普勒、牛顿等在其理论基础之上不断取得新的突破,特别是伽利略的望远镜解决了哥白尼理论的不少困难。

事实上,将计量技术运用于对自然现象的观察,不仅获得了新的素材,如观察数据、调查数据、统计数据等,也对以整体性知识呈现的学术提出了严峻挑战,带来了自人类树立理性以来的另一场学术变革。直接的后果是自然科学同整体性学术的分离,这也是人类知识创新与积累的第二个阶段,不过,这还不是文科发展的第二个阶段。自然科学的独立不只是人类理性同诸神的决裂,还是人类理性内在的分化。伴随自然科学分立的是分科知识的创新与积累。计量不仅推动了分析方法的发展,形成了科学界共识的科学实验方法,还推动了以演绎逻辑为特征的理论发展,让知识的创新与积累从对自然现象总体性的把握转向对具体规律的追寻。

受自然科学影响,在面向社会现象时,人们也同样试图运用计量技术开展研究,这便是文科发展的第二个阶段。随着统计思维发展为统计科学,对社会现象规律的追寻也成为分科学术的重要组成部分。社会科学各学科的建立与发展正是这一历史潮流的直接后果。政治学、经济学、社会学、教育学、法学等莫不如是。新素材的出现推动了新方法的发展。比照自然科学的实验方法,社会科学发展出了思想实验。为了证明思想实验的现实性,社会科学又发展了实证分析,用客观事实证明逻辑推理的现实性。对现实逻辑的归纳和检验则推动了对社会现象规律的检验。文科由此不再满足于对人类价值和意义的阐释,而希望通过对社会规律的发现和检验,减少人类面对的不确定性,进而增进人类的福祉。

紧随自然科学潮流,试图对社会规律进行探讨和对社会现象进行解释的分科学术也制造了一个理想与现实的悖论:学科化的规律探索与整体性人类生态的背离。与自然现象不同,社会现象原本具有整体性和生态性,学科化的确可以在给定条件下获得社会具体现象的规律,却忽略了社会现象之间的整体关联和生态关联。一系列来自严格给定条件的具体规律,在面向一般社会现象时,顷刻间变得离散化和碎片化,难以让人们建立面向日常社会现象的总体图景,也难以让人们在总体上把握社会规律,自然也无法复盘社会现象。这便是科尔曼著名的宏微观悖论(coleman, 1994)。以此为依据,人们总认为社会科学是“软”的,与人们试图从现象获得的对社会的认识还差着一步。其实,这正是社会科学的软肋:难以形成对社会现象的拟合或重建。

文科发展的第二个阶段并不彻底。随着社会科学同整体性学术的分立,整体性学术的剩余便是如今的人文学科。只是,这些剩余中的少部分也还在试图进入科学阵营,如计量史学、科技考古、分析哲学等。这些剩余中的大部分则还保留了传统整体性学术的特征,用第一阶段的方法分析第一阶段既有素材,阐述人类的价值和意义。

基于计量的对自然规律的探索给人类带来了具体且丰厚的回报。工业革命是以自然科学为基底的,人类物质生活的丰富又是以工业革命为前提的。自然科学与工业技术的互动,在带来人类物质生活极大丰富的同时,还大大地延展甚至替代了人类的体力,把人类从繁重的或无力承担的体力劳动中解放出来。与此同时,人类还希望分科学术对社会现象的探索可以与自然科学对自然现象的探索一样为人类的社会生活带来更大的确定性。遗憾的是,从经济到政治、从心理到社会,社会科学并没有让人类得偿所愿,如今的人类依然面对着众多难以解决的社会难题,文科也依然是一个有待积极发展的学术领域。

归纳起来说,在学术发展的历史里,与其说文科经历了三个阶段,不如说文科是科学革命的剩余。整体性知识创新与积累是学术的发端,在随后的发展中,对自然现象的学术探索随着科学探索三要素的计量化而分立出来,形成了被认为是“硬科学”的自然科学,即理科;剩下来的部分被认为是“软”的,称之为文科。随着对社会现象的学术探索也开始遵循科学逻辑,再次剩下的部分便被称为人文学科。换句话说,不严格满足科学逻辑的学术(在许多自然科学家看来,社会科学也不满足科学逻辑),便是人们所说的文科。

技术脉络里的人工智能

人们热议的人工智能或许各有不同的所指。概略地说,至少有三类不同的指称(蔡自兴等,2020)。例如,作为能力的人工智能;作为机器的人工智能;以及作为学科的人工智能。笔者认为,机器是能力的载体,是学科的产出。因此,这三类指称的人工智能,在本质上其实是一类,即机器智能。因此,笔者也更愿意用机器智能表述人工智能。

1956年召开的达特茅斯暑期研讨会议标志着人工智能作为一个学科的诞生。《关于举办达特茅斯人工智能暑期研讨会的提议》(a proposal for the dartmouth summer research project on artificial intelligence)首次提出了“人工智能”(artificial intelligence)概念(mccarthy et al., 1955),认为人类学习能力的一切方面,以及智能的其他一切特性在原则上都可以被精确刻画,从而可以用机器作为载体进行模拟。机器可模拟诸如语言运用、概念抽象、问题求解、自我改进等人类能力。以此为基础,人工智能至少包括以下7个方面:(1)自动计算机,以程序模拟人脑的功能;(2)计算机对语言的使用(学习新词汇,并按照规则进行语句推断);(3)神经网络(假想神经元如何排列组合形成概念);(4)计算复杂度理论(建立衡量计算复杂度、改进计算效率的标准);(5)自我改进;(6)抽象能力(从各种感知数据中进行抽象);(7)随机性与创造力(通过有控制的随机性来模拟人类思维的创造性)。可以认为,人工智能当下探讨的主要技术性议题在那次研讨会上均已涉及,不过尚没有涉及后来极具争议的对“智能”的界定。

人们对智能的理解大致有两类。第一类认为,人类智能是理解和学习事物的思考能力,强调将智能与本能区别开来(蔡自兴等,2020)。例如,计算机科学家明斯基就将智能理解为“解决困难问题的能力”(minsky, 1985)。第二类则将智能视为应用知识处理问题的能力或由目标准则衡量的抽象思考能力(蔡自兴等,2020),强调人类如何适应环境并达成系统目标。例如,有人将智能定义为给定一个输入集或给定条件下进行正确决策的能力(琼斯,2010)。计算机科学家纽厄尔和西蒙则将涵盖了人类智能的“一般智能行动”定义为,发生在实际情境中在一定的速度和复杂程度约束下,适合系统目标、适应环境需要的行为(newell and simon, 1976)。如果跳出人工智能的技术逻辑观察人工智能,在笔者看来,两类能力都是智能,是智能的一体两面。学习能力是获取知识和积累技能的能力,处理问题包括进行决策则是运用知识和技能的能力。两类能力都是人类智能的重要组成部分。既然如此,人工智能和人类智能又有什么关系呢?人工智能是否为人类智能的孪生?

罗素和诺维格指出,有些人根据对人类行为的复刻来定义智能,而另一些人则更喜欢用理性(rationality)来抽象地定义智能(russell and norvig, 2021)。智能原本各不相同:一些人将智能视为内部思维过程和推理;而另一些人则关注智能的外部特征,即智能行为。事实上,既有的探讨实际覆盖了4种可能的组合(如表1)(russell and norvig, 2021)。

表1 理解智能的4种组合

来源:作者根据s. russell and p. norvig, 2021, artificial intelligence:a modern approach (4th edition), new york: pearson整理自制

崇尚类人智能的人有他们对智能的定义。一年多来,人工智能热议中经常出现的图灵测试是用类人行为理解人工智能的典型例子。图灵提出,如果人类提问者在提出书面问题后无法分辨书面回答是来自人还是来自计算机,那么,这样的计算机便是“会思考的机器”(turing, 1950)。值得注意的是,类人行为有特定的指称,如需要智能才能完成的任务(raphael, 1976),能够发挥需要人类智能才能实现的功能(kurzwell, 1990),又或者是执行人或动物具有的智能任务(dean et al., 1995)等。这些理解,如今被标准化为自然语言处理、知识表达、推理、学习、视觉等(russell and norvig, 2021)。

除了行为,强调思维的人认为,会思考才是智能,主张使计算机像人类一样思考(newell and simon, 1961),甚至主张反推人类思维机制。持这类观点的学者认为,人工智能是使计算机能思维、具有智力的新尝试(haugeland, 1985),是与人类思维、决策、问题求解和学习等有关的自动化(bellman, 1978),是模拟人脑从事推理、规划、设计、思考、学习等思维活动(rich, 1983)。

同样,推崇理性主义的人也从行为与思维两个维度提出了自己的主张。关注思维的人认为,智能并不在于逼真地模拟人类,而在于正确思维的法则与无可辩驳的推理过程。逻辑主义传统追求用精确的逻辑符号系统刻画物体及其关系,并用程序求解一切可用逻辑符号刻画的问题。例如,用计算模型研究智力行为(charniak and mcdermott, 1985),用计算拟合理解、推理和行为(winston, 1992),甚至有人极端地认为,智能即知识,即怎样表达知识,怎样获取知识和怎样使用知识(nilsson, 1998)。

关注行为的人则认为,智能在行动上是一种智能体(agent,社会学称之为能动的行动者),是在环境中、在与其他智能体共存时,能够持续自动运转的实体(shoham, 1993),它既是人工智能的初衷,也是人工智能的目标(hayes-roth, 1995)。还有一些观点,虽然没有使用智能体概念,却明确地以理性行动为标准,如通过计算力图理解和模仿智能(schalkoff, 1990),探索智能(nilsson, 1998),或建立自然智能实体(genesereth and nilsson, 1987)。

无论在技术层次对人工智能的理解有多复杂,在与人类智能关联的意义上,笔者认为,第一,尽管观点各异,但机器智能是一类思维智能。思维的内在是否满足人类思维逻辑,是技术层次甚或理想层次的议题,关键是可以输出为智能行动。第二,智能行动具有阶段性。类人智能是智能行动的初级阶段,理性主义则是智能行动的理想目标。如何达成是科学与技术的目标,对应用而言,关键是面对一个需要解决的议题,具有不同智能类型和层级的人工智能与人类智能之间究竟是什么关系?给定我们讨论的场景,即,对文科而言,人工智能现在与将来究竟意味着什么?

学术智能里的文科未来

在人工智能向一切渗透的历史潮流中,学术智能是一个无法阻挡的部分。面向人工智能,就像历史中的文科和理科一样,理科已经先行一步,形成了理科智能。或许,我们可以从理科智能的努力中窥见文科未来。

理科智能的英文表述——ai for science,字面含义非常清晰,即运用人工智能进行科学探索。言下之意是,人工智能是科学研究的新工具,科学研究则是人工智能的应用场景。不过,还是有人持有不同的观点。汤超(2022)认为,理科智能有三个层次:第一是把人工智能技术、特别是深度学习技术应用于各个学科中的科研、技术创新、成果转化等之中,只是在实践中是属于从1到10、10到100,甚至10到1000的发展,而从0到1的突破性原始创新不多;第二是运用人工智能发现新的科学定律、创立新的科学范式、引发新的科学革命,而不仅仅是充实、完善已有的科学范式;第三是人工智能科学(science of ai),研究人工智能的科学原理,如2021年诺贝尔物理学奖研究的自旋玻璃模型发展的统计物理理论对神经科学和机器学习的影响。笔者认为,汤超的观点有点混杂,他的第一、二层次实际是同一个议题的递进表述,第三个层次则是人工智能这一专门领域的前两个层次。说到底,理科智能是运用人工智能进行面向自然现象的知识创新和积累,创新即汤超所说的第二个层次,积累即汤超所说的第一个层次。那么,如何运用人工智能进行创新和积累呢?

有人对理科智能的既有发展进行了归纳(wang et al., 2023)。当下,人工智能在理科知识创新和积累里扮演的角色依然是工具性的。

第一,助力数据清理和提炼。在数据筛选中,实时识别并舍弃原始数据的背景噪音,保留富含信息的数据。例如,使用异常检测(anomaly detection)算法能够将稀有事件作为异常数据进行识别并保存。在物理学、神经科学、地球科学、海洋学以及天文学等领域,数据选择智能得到了广泛的应用。

在数据注释中,训练有监督的模型需要依赖带有标签的数据集,然而,对生物学、医学等实验性学科来说,生成大量准确标签的数据集既耗时又耗力。伪标签法(pseudo labelling)和标签传播法(label propagation)便是更优的替代方案,它们允许在只有少量准确注释的大型无标签数据集中进行自动注释。此外,主动学习还可以帮助科学家确定最有必要进行实验标注的数据点,从而进一步降低成本。另一种数据注释策略是借助专业知识制定标签规则。

在数据生成中,通过自动数据增强(auto augment)和深度生成模型(deep generative ai)生成额外的合成数据点、扩充训练数据集,是创建更好模型的有效方法。例如,生成式对抗网络(generative adversarial network)可以在多个领域中生成逼真且有用的数据,从粒子碰撞事件、病理切片、胸部x光、磁共振对比、三维材料微结构、蛋白质功能到基因序列。

在数据提炼中,人工智能则能进一步提高测量分辨率、减少噪声,并减小测量精度的误差,使之具有一致性。例如,黑洞成像、捕捉物理粒子碰撞、提高活细胞图像的分辨率,以及细胞类型检测。

第二,学习有意义的数据表达。在数据表达中,几何先验、几何深度学习、自监督学习、语言模式化、转接构架(transformer architectures)、神经算子等均能够在多层次数据中提取有意义的表达方式、优化表达,以指导研究。

第三,支撑科学假设建构。科学家们在实践中体会到,人工智能在假设构建的多个阶段都可以发挥重要的支撑作用。例如,可以在噪声观测中识别候选符号表达式,进而生成假设、帮助设计(如一个能与治疗目标结合的分子),或设想可以推翻数学猜想的反例。此外,人工智能可以学习假设的贝叶斯后验分布,利用分布生成与科学数据和知识相吻合的假设。实践策略如黑箱预测、引导组合假设空间、优化可微假设空间等。

第四,驱动实验与仿真。实验成本高昂、操作复杂是理科始终面对的实践难题,计算机仿真一直是替代方案,人工智能为计算机仿真提供了更为有效和灵活的实验手段。科学家可以通过人工智能识别和优化假设进行测试,还可运用计算机仿真进行假设检验。例如,对科学假设进行有效性评估,运用仿真对假设进行推演观察等。

也有人认为,理科智能是自然科学的新范式(zhang et al., 2023)。学者们系统地考察了用于量子、原子和连续体系统的人工智能应用,认为从亚原子(波函数和电子密度)、原子(分子、蛋白质、材料和相互作用)到宏观(流体、气候和地下)尺度,通过深度学习捕获自然系统的物理第一性原理尤其是对称性,是具有挑战性的人工智能运用领域,其中可解释性、分布外泛化、使用基础和大型语言模型进行知识转移以及不确定性量化,都是人工智能运用的重要场景。还有人考察了人工智能在基础科学的应用(xu et al., 2021),如信息科学、数学、医学、材料科学、地球科学、生命科学、物理和化学等。

对20余位数据科学家进行的半结构式访谈研究(wang et al., 2019)还表明,人工智能还运用于自动化数据科学家的工作实践,如auto ai或auto ml系统能自主获取和预处理数据、设置新特征,并根据目标(如准确性或运行效率)创建模型、给模型打分等。科学家们认为,人工智能一方面加快了构建数据科学的进程;另一方面还可能过度降低数据科学从业人员的技术门槛。

还有科学家在设想一个能够在生物医学科学领域进行重大科学发现的人工智能(kitano, 2016),如生成并验证大量假设,开展实时的随机推断、开展多策略的适应性学习、保持无限的数据记忆容量、执行大量并行异质处理等。在这些进程中,人工智能可以克服人类在信息处理能力、知识表达能力、表型能力(phenotyping)等方面的认知局限、推动生物医学实现研究方法的迭代升级,使科学发现变为高效的实践成为可能。

科学家们认为,理论上,人工智能系统可以检验所有可能的假设,重新定义科学直觉的本质与科学发现的过程。应用于科学发现的人工智能将超越现有的人工智能与专家组合,成为顶级研究机构的基础设施,甚至有望居于其他人工智能系统和人类智能体网络的中心,协调大规模的人机智力活动。例如,实现对数据的自动化分析和发现,系统、准确地搜索假设空间以确保最优结果,自主地发现数据中的复杂模式,实现小规模科学过程应用的可靠、一致、透明和可复制(gil et al., 2014),包括在处理大数据、发现长尾的暗数据等方面作出贡献,并通过工作流程系统实现科学发现过程的自动化(gil and hirsh, 2012)。

纵观理科智能的实践和科学家们对理科智能的洞见,我们可以作如下归纳:

第一,数据是理科智能的前提,没有数据便没有理科智能。理科数据有两类来源,一是科学活动产生的数据,如实验数据、观测数据、传感数据、调查数据等,在人工智能可以运用于理科之前,理科已经在依据数据做研究;二是人工智能生成的数据,在给定事物之间关系的前提下,人工智能有能力产生可用于研究活动的数据,即生成式数据。

第二,人工智能有助于标记数据、清理数据、筛选数据、分析数据、表达数据。理科数据的规模和类型多元且复杂。清理数据曾经是工作量巨大且劳动力密集型的科学活动,无论是实验或观测产生的数据还是人工智能生成的数据,人工智能都可以用于标记数据、清理数据、筛选数据、分析数据、表达数据,让数据以科学家希望的形式精准地呈现。

第三,人工智能有助于检验或发现事物之间的关系模式。运用数据检验科学假设是科学研究最重要的活动之一,人类计算能力的局限一度导致可以运用于假设检验的数据量非常有限,人工智能之于科学计算,有能力在假设检验中纳入更多数据和参数,如生成式大模型的参数量级已经逼近万亿,完全达到了人力不可及的量级。不仅如此,计算能力和模式发现(如机器学习,无论是哪种学习)能力的增长,让人工智能所具备的从数据中发现事物之间关系模式的能力早已超越了人类,人工智能可以实现从数据中发现模式,使得创新和积累知识不只是理科智能的应用场景,甚至开始运用于生产实践,如药物筛选、材料发现,等等。

第四,人机互生,科学家与机器智能相互促进。对理科智能的众多讨论只是刻画了科研实践,即使提及理科的新范式,也语焉不详。其实,科研实践已经揭示了理科智能的应用场景,这也是在之前的理科中不曾出现的部分。例如,人机之间相互启发与互动,一方面机器给人类带来灵感,启发人类进行创新;另一方面人类也给机器提出难题,挑战机器综合人类知识和从知识中发现新知识的能力,促进机器智能能力的迭代创新。既有的人工智能运用几乎都能证明这一点,如alpha fold 2与蛋白质结构预测、graphormer与分子建模等。

除此以外,笔者认为,关于理科智能的讨论有一个重要缺失,即对知识创新与积累的路径缺乏讨论。截至当下,几乎所有讨论都还是以既有分科学术为默认前提的讨论,没有触及类似科学革命带来的分科学术的路径讨论,或者尚未提及知识创新与积累的新形态或新范式。

即使如此,文科智能可以从理科智能中看到怎样的未来呢?对此,笔者在之前的讨论已有部分述及(邱泽奇,2023),这里不妨摘其要而论。

第一,与理科智能一样,文科智能的前提也是数据。在一定程度上可以说,理科在科学革命之后就完成了以数据为支撑的科学逻辑建构,而文科还没有完成以数据为基底的知识创新与逻辑建构。可只要缺乏数据,就难以让人工智能进入文科智能。因此,文科未来的第一阶段工作是素材的数据化,将对社会现象的刻画从文字的、形象的转变为数据的,从碎片化的、离散化的数据转变为汇聚化的、可以彼此关联的数据,进而为运用算法、回到整体视角提供条件,且可以让人工智能支持甚至支撑数据化,如一切非数据素材的数据化。不仅如此,人工智能同样可以针对社会现象生成数据。简言之,“一切皆可数据化”的逻辑同样适用于文科素材。

第二,接下来的场景,文科与理科是一致的。如标记数据、清理数据、筛选数据、分析数据、表达数据,让数据以文科学者希望的形式精准呈现。再如,检验假设、发现规律等。需要特别说明的是,素材的数据化将改变人文与社科分立的现象,使得对人类精神的探索与对社会规律的探索殊途同归。直到当下,人类精神现象是否存在规律还是一个悬而未决的议题,对精神分析的争议便是明证。文科智能至少可以让文科学者们证明人类的精神世界是否有规律可循。同样,文科智能也遵循人机互生的模式。其实,彭特兰的实验已经证明,人类智能是在小群体中被激发的,在小群体中有一个记忆力、算力、归纳和综合能力超群的同伴,意味着人机互生将获得更大创造力(阿莱克斯·彭特兰,2015)。

第三,文科智能的知识创新与积累更有机会突破科学革命之后文科的悖论,迈向新的综合,以可靠的、可检验的整体性知识造福人类。与理科智能不同,除了运用数据检验假设、发现规律,形成给定条件下的具体规律,文科智能还需要将具体场景的规律整合起来,形成彼此关联的、有助于人们理解和解释日常现象的知识动态。换句话说,由文科智能带来的知识不再是严格约束条件下的、面向社会现象的规律,而是以日常为条件的、面向日常社会现象的理解与解释。文科智能带来的文科知识创新与积累,在外显形态上理应成为每个人触手可及的知识源。

而要实践文科智能,除了面对理科智能的挑战以外,还有文科特定的挑战。在学术智能中,无论是理科还是文科,当下的实践路径都是建立在科学革命之后分科学术路径基础上的,人们已经养成了对专门问题进行深入挖掘的习惯,如何重新回到“深入浅出”的路径上,在专门知识之间建立联系,让专门知识成为日常知识池,还没有一条明确的可以实践的路径。算法创新或许是路径探索的关键(wang et al., 2023)。在海量数据环境下,不要说深入浅出,即使只是深入,没有算法也寸步难行。

更大的难题还在于,当下,学术界似乎还没有充分认识到人工智能对学术的影响力,更缺乏相关能力的积累。从数据化、模型化、算法化到知识化,每一个环节与环节关联,文科未来的起点似乎要从培养跨学科的人才开始。

结论

之所以在概念层次探讨文科未来,诚如读者所见,文科智能的发展还没有进入理科智能的阶段,还没有可以讨论的实践和细节。尽管如此,文科未来的方向是明确的,那就是与理科智能一样,推动人工智能与人类智能彼此互生,通过知识积累和创新,形成人类知识的新形态,也形成知识服务于人类的新格局,促进人类对自身的理解与解释,进而增进人类福祉。

文章来源:《学术前沿》杂志2024年1月下(注释从略)

原文责编:李思琪

新媒体责编:梁丽琛


转载本网文章请注明出处

网站地图