联想集团CTO芮勇:大模型下一步是智能体

【环球网科技综合报道】“我们不能再单纯地用大数据+大算力+大网络来堆砌大模型,而是要超越大模型,探索更接近人类思维和行为方式。”4月18日消息,第十届联想创新科技大会(2024 Lenovo Tech World)在上海举行。联想集团高级副总裁、首席技术官芮勇博士表示,过去16个月,大模型可以说是AI历史上的一个重要里程碑,它开启了人工智能发展的新纪元。但大模型的局限性也越来越明显。

会上,联想集团董事长兼CEO杨元庆展示了联想混合式AI框架。左侧是大模型,右侧是AI智能体。

对此,芮勇指出,大模型发展的下一步是基于大模型的智能体。大模型一方面能力很强,另一方面有局限性。“所以我们要‘扬长长短’。‘扬长’是我们要持续发扬并增强大模型的强大能力。‘长短’是我们要打造基于大模型的智能体技术,真正解决应用场景的问题。而联想的理念是,‘左手抓大模型,右手抓智能体。’”

从增强大模型的“左手”来说,联想倡导混合人工智能框架,是公有大模型和私有大模型的混合。

芮勇进一步表示,增强大模型的基础能力主要体现在4个维度的混合技术,包括基于大模型与小模型混合的“意图理解”技术,基于CPU、GPU、NPU混合调度的“异构计算”技术,基于模型微调(SFT)与检索增强(RAG)混合的“智能问答”技术,以及基于硬件加密与全栈可信架构的混合“隐私安全”技术。

“四种混合式技术需要端边云协同、软件硬件协同和传输与计算协同。”芮勇指出,联想的新IT架构“端-边-云-网-智” 正好为混合式技术的实现提供了强大支持。

从打造智能体的“右手”来说,智能体基于大模型而又超越大模型。在大会现场,芮勇也分享了联想智能体的技术框架。位于中间的是大模型,相当于控制中枢。同时,智能体需要有知道自己能力边界的能力,知道什么时候应该调用工具,调用什么样的工具。此外,它还需要具备主动感知、意图理解、复杂任务的分解能力,以及长短期的记忆机制。