欧宝平台AI能取代“爱因斯坦”吗?
走在阳光下的草坪,手机上突然弹出天气预警,30分钟后有雨。然而,一个AI气象大模型告诉你,可以继续坐在草坪上,享受和煦的温暖。
2023年9月1日,复旦大学2023级新生开学典礼在光华楼前大草坪举行。这是近20年来复旦大学第一次的户外开学典礼,本科生和研究生齐聚一堂。
对于这次不同寻常的开学典礼安排,复旦大学校长金力自有其道理。尽管在开学典礼前,气象台预报典礼当天有雨,但“伏羲大模型很坚定地认定,今天上海不会下雨”。
尤其当你知道,这个气象大模型,只需要不到三秒钟,就能让你足不出户地精准预知全世界任何一个国家和地区的天气状况,预测时间长度甚至超过未来一个多月时,你又会怎么选择?
这不是凭空想象,而是在现实生活中的真实场景。一直以来,AI在不同专业领域超越人类是个被说烂的话题。即便AI即将取代气象学家,你或许依然不会感到惊讶。
在AI技术前沿的探索方向上,这条道路被称为“AI for Science”,简称“AI4S”,也就是用AI去攻克科研难题,培养AI成为像牛顿、爱因斯坦那样的伟大科学家。
围绕这两个目的,科学界形成了两套主要研究方法——从数据中总结规律和从规律中推导原理。
高中物理学课本有讲过,德国天文学家开普勒把老师第谷的天文观测数据进行整理分析,发现了行星运动三定律,比如所有行星围绕太阳运动的轨道都是椭圆形的,太阳在椭圆的焦点上;又比如行星靠近太阳时,速度会加快,远离太阳时,速度则会减慢。
所以英国物理学家牛顿在这个基础上提出了力学第二定律和万有引力定律,将行星运动问题归结为一个常微分方程问题,并推导出行星运动三定律。
◎ 从数据中总结规律,开普勒发现了行星运动的科学规律,回答了行星运动是什么样子的。
◎ 从规律中推导原理,牛顿推导出了行星运动的基本原理,则回答了行星运动为什么如此运转。
通过这两套方法,科学界不断地研究数据,发现规律,推导原理,解决问题,实现了科学的进步并反哺到各行各业的发展。
再回到用AI来做科学研究的问题,那接下来就要回答:AI如何在这两套方法的过程里,给予人类帮助?
从应用层面看,科学界在量子力学建立后,寻找并发现基本原理的任务取得了极大突破。在拥有基本原理的基础之后,科学研究的目的,主要变成解决实际问题,研究方法也主要变成,从数据中总结规律。
因为当前的科学发现,主要依赖于实验和人脑智慧,而AI在记忆力、高维复杂、全视野、推理深度、猜想等方面具有较大优势,从数据中总结规律,因此AI能主动进行科学发现和技术发明。
原阿里巴巴副总裁,现复旦大学人工智能创新与产业研究院院长漆远就指出,AI在蛋白质设计、药物设计、健康管理等领域的科学研究方面极具潜力。
一个典型的案例是2021年,曾经创造了“阿法狗”的公司DeepMind,正式发布了AlphaFold 2。
这个AI项目成功预测了98.5%的人类蛋白质三维结构,而且它预测的结构,与大部分蛋白质的真实结构,只有一个原子宽度的误差。
而以往科学家想要预测成功蛋白质的结构,需要花费多年时间,进行上百万次的验证实验。
高中生物课本提到,蛋白质的最小单位是氨基酸,多个不同的氨基酸连接成多肽链,多肽链达到一定的长度,便会组成蛋白质的一级结构;一级结构局部折叠,形成二级结构;所有的二级结构在三维空间中形成的形状,就是蛋白质的三级结构。
就像幼儿园玩的“串珠子”游戏,珠子串得越多,不仅排列越复杂,串好的珠链子,本身也会具备不同的形状,在一个空间里也会显得越复杂欧宝平台。
而蛋白质的功能,由蛋白质的三级结构决定。在预测蛋白质结构的领域,诺贝尔化学奖得主还提出过一个“安芬森法则”,即蛋白质的一级结构能决定最终的三级结构。
所以当科学家看到具备某个功能的蛋白质时,只要知道它的一级结构,就基本能知道一切。
不过,虽然这听起来难度已经大大降低,但组成蛋白质肽链的氨基酸数量依然庞大到让人恐惧,通过一级结构来预测蛋白质折叠后的三级结构,依然非常困难。
直到2018年AlphaFold横空出世,它先学习大量蛋白质的序列和结构数据,从中寻找氨基酸分子之间的相互作用,以及蛋白质片段之间的演化规律,然后再按照找到的规律对蛋白质的结构进行预测。
2022年,DeepMind在官网上宣布,AlphaFold已对几乎所有已知蛋白质的结构做出了预测。它的预测的精确程度,直接让不少科学家怀疑起了自己,以至于《Nature》杂志声称“它会改变一切”。
既然AI for Science已被成功证明是大有可为的方向,那接下来该如何实现在这方面的突破?
漆远的回答是:“数据、算力和人才是AI如今发展的必需要素。同时,生产要素、技术要素要达到足够丰富且便宜的程度。”
在他的答案里,人才取代了原本AI发展三要素——数据、算力、算法中的算法。
AI的三大要素里,数据构成了最直观的壁垒。GPT 3.5、Llama 2等大语言模型,即使曾开源了模型源代码,也都未选择公布训练数据集。而如果没有优秀的数据集,就很难训练出优秀的AI模型。
一方面,AI算力的能耗过大。例如,用1000张英伟达V100 GPU训练GPT-3大模型,单次训练耗电就相当于一个人4年的生活用电总量。
另一方面,算力芯片存在缺口。英特尔、AMD和英伟达占据了国内85%以上的服务器芯片市场,高性能芯片的供给严重不足。
而算法的需求,本质是对AI大模型人才的需求。行业智库MacroPolo发布的《全球AI人才追踪2.0》报告显示,美国拥有全世界最多的AI精英,占比57%,相比之下,中国只有12%,两者相差约5倍。
所以,如果中国想在AI for Science方面实现重大突破,这三大要素就至关重要。
在《云上的中国》第三季中,吴老师提到:“科技进步中最大的一个推动力,除了天才以外,就是大学和创业者和大型企业之间互相推动的结果。”
原本在阿里担任副总裁的他,曾建立并带领团队开发了阿里首个基于参数服务器的超大规模机器学习平台;他还建立起阿里第一个专业的基于深度学习的语音识别团队,迅速将语音识别能力提升到世界先进水平;在蚂蚁金服,他领导的人工智能部门将机器学习应用于各个业务线。
后来漆远加入复旦,担任人工智能创新与产业研究院院长,又在上海成立了一家主攻AI for Science的研究院。
这个过程中,通过将阿里云的算力资源引入一流高校,他推动机器学习在学界实现突破,让AI不仅有产业应用,还真正驱动硬核科技创新。
在他看来,通用大模型领域,相比于国外,国内更需要产学研一起抱团突破。他说:“在创新链资源方面,我们可能未必非常充足。但把高校、产业企业、创新机构结合起来,我们同样可以做很多探索和研究。”
“国际上最好的高校都有同样的挑战。老师很厉害,很聪明,但数据不够多,算力也有欠缺。”他的路径是,在中国的AI创新链资源距世界领先水平仍有差距的情况下,高校可以与产业、创新机构进行合作,优势互补,促成良性的“化学反应”。
“切问”和“近思”是复旦与阿里云联合建设的全国高校最大的云上科研智算平台——CFFF中的两个算力集群:“切问”位于乌兰察布,“近思”则部署在复旦校内。
这套算力集群,可以给复旦的科研人员提供“天涯若比邻”般的支持便捷度。从内蒙古的乌兰察布到上海,数据传输的时间只有几毫秒。
算力集群甚至不光是面向复旦校内,也对外开放。漆远说:“希望这个集群能成为一个支点,去帮助和促进更多相关的科研工作。”
回到2023年9月的那个复旦操场,金校长最终选择相信“伏羲”,而最终事实证明,“伏羲”是对的,那天天色虽阴,但真的未曾落雨。
根据金校长当时的介绍,“伏羲”是复旦在国内高校最强的云上科研智算平台上,训练出的气象大模型,拥有45亿参数,每次预测耗时不到3秒,能精准预报未来15天的全球天气。
“伏羲”并未止步于此。在持续的迭代优化下,如今“伏羲”气象大模型对全球天气的预报天数,更是延长到了42天。
漆远在纪录片中说道:“ChatGPT是对语言的建模,Sora是对视觉的建模,而伏羲是对真实世界的建模。”
在他看来,许多中国大学之所以无法在AI for Science上取得科研突破,就在于缺乏算力,而复旦的成功恰恰提供了一条可行的路径。
他说:“当复旦大学有了算力中心后,它就能在半年时间里,做出中国最好甚至全球领先的气象大模型。”
他的回答是:“未来几年出现的概率很小,但十年后会是什么样,没有人能预测。”
他表示:“今天的AI能力还不够强。目前的大模型只是对世界的压缩,还不具备探索世界各种可能性的能力。”
在他看来,AI for Science的真正意义,在于去探索和发现科学定律,因为发现科学定律才是人类在智能表现上的“皇冠上的明珠”。
从发现勾股定理的毕达哥拉斯,到建立经典力学体系的牛顿,再到提出相对论理论的爱因斯坦,漆远说:“这些正是构建人类社会知识和智能的关键节点。”
直到有一天,出现堪比爱因斯坦智能表现的“AI节点”时,人类世界便会看到更大的可能性。
他在六七年前参加过机器学习领域的顶级会议NIPS。当时会议上讨论的内容是,未来多久才能出现接近爱因斯坦水平的AGI(通用人工智能)。
“在那个时间点上,有人认为再过100年都不会发生这件事。”漆远说,“但是,在ChatGPT出现后,事情就变得非常有意思。有人认为,这件事的发生时间会大幅缩短。”
漆远看到了希望,原来是有多少人工才有多少智能,如今在人工智能和数据结合后,“通用人工智能的火花”已经开始在不远的地方闪烁。
“未来是什么样,没有人知道。人工智能的技术飞跃正在加速。这就像人一样,小学的时候觉得日子都很慢,到了四五十岁时,发现一切变得越来越快。”他说。
漆远说:“科学尝试基于通用规律以简单优美的方式解释世界,这也叫作‘奥卡姆剃刀原理’。但这些仍基于人类的思考范式,AI也许会带来范式转变,找到更简洁的路径。”
他认为,或许存在另外一种可能:AI 发现的科学,未必是用今天的语言来书写,也未必是人类能理解的。
AI领域一直流传这样一个公式:AI+HI=SI,即人工智能+人类智能=超级智能。或许情况的确如此。AI擅长“解题”,科学家擅长发问。
未来,或许是科学家向AI发出醍醐灌顶之问,AI则在理论的边界上探寻一个又一个高峰。
不仅仅是科研,在当下的中国,无论是高校研究者,还是企业开发者与行业创业者,每个人都面临AI发展的“大航海时代”。
漆远提到:“在AI诞生前,很多用产业互联网来改造传统行业的试验,已经在按部就班地进行。但是在2023年以后,突然间算力发生了几何级变化,处理的数据量从原来的几亿级,变成现在的上千亿级。”
然而根据中国信通院的数据,美国服务器存量规模约为2100万台,其中有60%部署在公共云。中国服务器存量规模是2000万台,但只有28%在公共云中,不仅不到美国的一半,也低于欧洲的50%。
正如“伏羲”的成功所展示,只有链接起科研和产业界多方的力量,充分利用和发挥算力的价值,才能船坚帆韧,在第三次技术浪潮下的AI时代谋得先机。
本文的观点和内容,来自《云上的中国》第三季纪录片与5月9日吴晓波频道人工智能专场对谈。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。