亚马逊云科技:生成式AI的关键一步怎么走?
4月8日消息,生成式AI正在席卷千行百业,而要拿到生成式AI的船票,「上云」,成为多数企业的第一选择。
随着生成式AI的崛起,亚马逊自2023年以来频频出击:去年宣布40亿美元投资人工智能初创公司Anthropic后,近日继续追加投资27.5亿美元,已完成对Anthropic的40亿美元的投资。
亚马逊云科技作为全球云厂商的龙头,其对于生成式AI的发展究竟到了何种程度?未来生成式AI的关键一步又要怎么走?4月2日,以「亚马逊云科技携手Anthropic 推进生成式AI创新」为主题的媒体沟通会在京举办,重点展示了一个月前发布的 Claude 3 系列大模型,并向媒体一一解答了相关疑问。
01、“没有一个模型可以适用于所有业务场景”
生成式AI从产品的发布到现在已有一年多的时间,亚马逊云科技与众多客户开展了各方面的合作。他们认为,各行各业的场景千变万化,虽然大模型的技术能力再强,但「没有一个模型可以适用于所有业务场景」。
在亚马逊云科技大中华区产品部总经理陈晓建看来,从模型能力到真正的运营生产之间,企业还需要增加很多辅助能力。
“尽管大模型非常重要,但仅靠大模型对你的生产是远远不够的,企业需要一系列周边的能力来正确、合理、安全、高效地使用大模型,这就是亚马逊云科技一系列产品所提供的价值所在。”
在此背景下,亚马逊云科技在生成式AI领域为客户提供了三层架构,通过这三层,不同的客户可以根据需求选择不同层级的产品来支持他们的业务。
第一层,是生成式AI云基础设施。
亚马逊云科技为客户提供了基础算力,包括英伟达最新推出的G200芯片。除此之外,亚马逊云科技还投入大量的力量来开发自研芯片,包括用于训练的芯片Amazon Trainium,目前已经是第二代,推理芯片Amazon Inferentia也已经进入第二代。除此之外,还包括用于训练和推理的平台Amazon Sagemaker。
第二层,是模型 。
也就是随着生成式AI出来的一些全新的产品,例如Amazon Bedrock,Amazon Bedrock通过一个模型平台支持多种技术大模型,这是亚马逊云科技提供的能力。
第三层,应用层。
亚马逊云科技推出生成式AI助手Amazon Q,并与智能客服的产品Amazon Connect和商业智能服务Amazon Quicksight结合,还有面向编程开发人员的平台Amazon CodeWhisperer等产品,支持不同客户的业务需求。
02、Claude 3,大模型新“卷王”
据了解,目前Amazon Bedrock提供各种领先的基础模型供客户选择,其中既有知名的开源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非开源模型。
这其中,Anthropic Claude 3在各种认知任务上树立了新的性能标杆。
Claude 3分为三个版本,分别为Haiku、Sonnet、Opus三款模型,简单理解的话,就是中杯、大杯、超大杯,客户可以根据自己的商业需求,从中选择最合适的智能、速度和价格组合。
- Claude 3 Haiku,具有几乎即时响应能力且最紧凑
- Claude 3 Sonnet,在技能与速度之间达到理想平衡状态
- Claude 3 Opus,为处理高度复杂任务设计的最智能模型
分享会现场,亚马逊云科技展示了Claude 3在处理数学问题、编程练习和科学推理等领域的能力。
图片的解释是多种应用场景都会遇到的问题,Claude3能够对一项图片文本进行识别,并对输入的图片进行问答。经过专业训练,Claude3可以非常擅长理解,包括像图片、图表、图形以及OCR扫描产生的图像,并且它的理解速度优于业界其他多模态模型。
受数据、模型结构以及训练算法等影响,幻觉的产生难以避免。Claude 3能够降低幻觉。受在处理挑战性开放问题(100Q Hard)上,Claude 3准确性明显提升,并且减少错误答案。
亚马逊云科技还展示了部分Claude 3应用场景,包括内容续写、代码辅助、电商商品描述撰写以及长文本知识召回总结。
例如长文本知识召回总结,可根据提供的相关服务文档,准确回答该服务在不同区域的价格且信息提取更完整;代码辅助,能够提供详细了步骤的代码步骤,帮助程序员在服务管理平台Nacos中正确修改配置。
据了解,Claude 3现已具备多模态能力——Claude 3可以接收基于图像的输入,能力与其他前沿模型大致相同,并且延迟低于其他多模态模型(尤其是Claude 3 Haiku),包括:
针对常见的企业用例进行训练:经过专门训练,它们非常擅长理解图片、图表、图形、技术图解及光学字符识别 (OCR)。
速度优于其他多模态模型:评估显示,Claude 3模型在图像输入能力方面与前沿模型相当,并且Claude 3 Haiku的速度优于所有能力相当的前沿模型。
在兼具速度和智能要求的用例中表现出色:Claude 3模型兼具低延迟和强大的功能,因此在需要处理大量图像、图表、报告和其他视觉资产的企业用例中表现出色。
03、生成式AI的关键一步,要怎么走?
当前的云计算厂商,阿里云请老罗直播卖云、京东实时比价......各种价格战反映出市场的白热化程度。从目前来看,“一招鲜吃遍天”的时代已经过去,对于大厂而言,如果只做云、或者只做大模型、只做芯片都会存在短板。
从云基础设施扩展到芯片和大模型的过程中,新的战场已经开启,在生成式AI的征程上,云厂商也有各自路径。
回到企业需求的视角,企业使用基础大模型至少有几个核心诉求,例如数据安全与合规、易用的AI平台和工具集。Amazon Bedrock提供对全球领先基础模型的接入,并提供拥有知识库、代理、Guardrails等各种便捷工具,同时确保数据隐私和安全,是企业构建和应用生成式AI的首选。
此外,亚马逊云科技拥有丰富的专业技术支持资源,包括架构师、产品专家、人工智能实验室、数据实验室、快速原型团队、专业服务团队,帮客户打通应用生成式AI的最后三公里的工程化挑战。
生成式AI领域接下来发展,最关键的一步是什么?陈晓建以生成式AI的三层架构为例做出了解释。
首先,从最底层来看,芯片性能仍然落后于需求。虽然半导体芯片的发展已经非常快,但模型本身参数规模的扩大实际上远超芯片的能力。“随着规模的扩大,模型的未来将变得越来越复杂。作为基础服务商,我们仍需关注的是如何实现这一目标,如何将底层能力、业务复杂度和大模型复杂度相匹配,使硬件发展赶上软件发展规模。”
其次,从模型本身来看,其能力还有很多发展空间。“今天我们看到的模型可能代表了一个博士生水平,但是能不能做得更好?比如达到教授或者院士水平?包括亚马逊云科技在内的诸多生成式AI供应商需要在未来持之以恒地去做模型能力方面的工作。”
在最上层与各行各业务相结合方面,陈晓建表示,亚马逊云科技所提供的Amazon Q与BI(商业智能)服务Amazon QuickSight的结合,与Amazon Connect智能客服的结合,类似于SaaS解决方案非常多。“我们需要思考大模型如何更易用的方式和更低的成本的为人类社会各行各业中的应用提供更好的模型能力。”
陈晓建还补充道,“我认为有句话表达得很好,生成式AI的iPhone时代已经到来。今天的演示让我们了解到,生成式AI能完成多少以前无法完成的事情。但要真正做成这件事情,我相信不仅是需要亚马逊云科技,整个行业都有大量的工作需要去做。”