【资料图】
今年以来,伴随着ChatGPT的持续火爆,大模型也进入高速发展期,国内外多家知名科技企业相继推出自主研发的大模型产品。那么大模型的技术原理是什么呢?
5月18日,受邀参加2023中国家用电器技术大会(CHEATC2023)的中国科学技术大学机器人实验室主任陈小平教授分享了他的研究和观点,他同时还担任中国人工智能学会人工智能伦理与治理委员会主委,在本次大会上陈小平教授发表了“人工智能的新发展:从大模型到柔性机器人”主题演讲,介绍了人工智能大模型的技术原理,以及人工智能在应用层面的新技术趋势。
中国科学技术大学教授陈小平
“大模型的根本原理就是在做预测”陈小平介绍道,人工智能发展到现在已经开启了第四次浪潮的进程,数据模型也由大数据驱动转向大训练驱动。和之前三次浪潮不同的是,新阶段的人工智能对训练数据的质、量和获取方式都有了全新的要求,最终形成能够应用于大规模真实场景的实例模型。他强调:“大模型并不是简单的一两种技术,而是集成大量技术的智能系统。”
大模型的兴起来源于生成式人工智能,当前,生成式人工智能已经并不仅是简单的进行语言和图像等内容的生成,而是基于对人的自然语言的精准处理来完成智能化人机交互。陈小平表示:“目前阶段,我们对于机器的语言处理预期是会说人话、能听懂人话、能回答问题,即使回答不一定正确。其中,基本的要求是说话要符合人的语言习惯。”由于人的语言习惯没有科学标准但是有经验标准,那么机器如何掌握和利用人的语言习惯呢?陈小平表示:“大模型的基本研究思路和成功秘诀是:从人类大规模的语料中提取语言痕迹,并用于人机自然语言的交互之中。”
大模型通过从人类原始语料中提取包括字、词、标点符号等语元,再根据前后语元的关联性进行语元回看,最终实现行为的预测。原则上,回看的语元数量越多,预测的准确性就更高。“目前大模型回看的语元至少有4000个,有的甚至可以达到10万个。”陈小平讲到。大模型技术体系以预训练模型为基础大模型,再通过专门训练的专用模型配合用户引导模型来精准理解和回答用户的问题。三大模型相互配合,人工智能回答的质量可以实现大幅度提升。
大模型的出现确实给人工智能带来了新的革新方向,但它并不能运用于现实场景的各个方面。陈小平认为,目前,中国人工智能亟需攻克的三大方面是智能制造、智慧农业和普惠养老。“攻克这三大战役,我们全球的格局将会发生彻底的改变。”另一方面,大模型带来巨大变化的同时也带来了新的挑战。比如,大模型在基于对人的功能进行模仿时,容易被认为是带有了情感和意识。“这是因为人习惯性的将自己理解的含义投射到大模型上,认为大模型说话也带有含义,但实际上是没有的。”陈小平表示,大模型的应用还可能会产生公共安全、就业和长期影响。
除大模型外,陈小平教授还在“物理世界中的人工智能”方面带来了新的科研成果。目前,我们投入应用的人工智能物理形态主要是刚性机器人,这种机器人的重复精度高,但灵巧性和安全性较低,适用于结构化的环境中,而在非结构化的环境中需要进行精准测量、建模和计算,技术要求较高,目前还不适用于大多数的行业。针对刚性机器人的这些缺点,陈小平提出了融差性原理,在智能机器人的操作对象的精准测量不可行、工作环境和操作对象的精准建模不可行、精准决策不可行这三个基本假设之下,研发了气动蜂巢网络软体手臂。这种手臂在灵活度和负载能力方面均有良好的表现,并且在有外力干扰和物体进行不规则运动时,均能实现精准化控制。可以预见,这种技术在家庭服务、情感交互、无人驾驶等领域有广阔的应用前景。另一方面,陈小平团队还将柔性手臂和刚性机器进行了结合,带来了“刚柔合一手爪”的实验结果,在不改程序和硬件参数、不使用力反馈传感器的情况下,实现对多形态物品的精准抓握。
关键词: