阿里云CTO周靖人:坚持开源体系 持续投入海外市场

【环球网报道 记者 李文瑶】5月9日,阿里云对外发布最新版大模型通义千问2.5,并系统性公布了阿里云AI应用的一系列新进展。

性能是阿里云首先强调的重点。阿里云在发布中引用了评测结果:在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo;通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V。

同时,阿里云CTO周靖人在接受记者采访时也再次强调了对开源的坚持。他表示,开源生态对整个全球技术领域的贡献是毋庸置疑的,“这方面再有任何的讨论,都已经没有太大必要”。

高调发布通义千问2.5

2023年10月,阿里云对外发布通义千问2.0,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。

随后,阿里云低调迭代通义千问2.1版本。

而此次发布的通义千问2.5,较2.1版本在理解能力、逻辑推理、指令遵循、代码能力方面分别提升9%、16%、19%、10%。

周靖人用“这个版本代表了全方位的能力提升”来形容通义千问2.5的性能情况,并表示:“今天我们的模型,特别在中文的方方面面,在文本的理解、文本的生成,成为今天整个行业的领导者。”

从评测结果来看,通义千问2.5的性能能够在全球市场中进行竞争。例如在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo;通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的首个选手,是智能编码助手通义灵码的底座。

在通义大模型问世一年多来,已经发展出了文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。

坚持开源体系

在采访时,周靖人再次强调了阿里云在开源路线上的坚持。周靖人说,通义系列开源模型下载量已经超过700万次,阿里云会坚持开源的模式,让更多人在开源模型体系上搭建应用,并行探索,这对企业进行创新性的开发,扮演至关重要的角色。

他说道:“大模型的发展离不开整个生态,不单单是通义本身的发展,我们更希望今天能够把AI技术发展的能力,赋能给企业和开发者,能够让大家更快地推进AI技术一系列的创新和发展。为此我们持续在做开源,我们在过去一段时间已经形成了一个完整的通义的开源体系。”

据了解,目前,阿里云模型的开源覆盖了各个模态,不单单是语言模型,也包括视觉模型、声音模型等,接下来还会覆盖代码模型开源。

阿里通义去年8月宣布加入开源阵营,沿着“全模态、全尺寸”的思路布局,覆盖不同参数量级,开源语言、视觉多模态模型。

而这一系列模型的开源,都能够让更多的开发者使用,能够在上面搭建更复杂的应用,甚至更复杂的Agent,更好地服务企业,更好推动整体AI产业一系列的发展。

今年2月初,通义千问团队推出最新开源模型系列Qwen1.5,随后在不到3个月的时间连续开出8款大语言模型,模型参数规模涵盖5亿、18亿、40亿、70亿、140亿、320亿、720亿、1100亿;Qwen1.5系列还推出了一款基于LLM开发的代码模型CodeQwen1.5-7B和一款混合专家模型Qwen1.5-MoE-A2.7B,均在开源社区收获热烈反响。

今年4月,通义千问宣布开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。而开发者可在魔搭社区ModelScope和HuggingFace等开源社区下载。

周靖人在谈到开源的初衷时表示,阿里云的目的还是希望能够把AI技术、能力能够赋能到需要的企业,赋能到开发者,所以阿里云愿意把最先进的技术能够跟产业应用有机地融合在一起,能够让更多的人在这样的模型体系上面搭建更多的应用。

“我们整个阿里云的策略不是说简简单单的开源,我们是要开源最强的模型。”周靖人透露,阿里云一方面做开源,但同时也有闭源模型,实际上形成的是一个开源和闭源的整体体系,为企业提供全方位的服务。

持续投入海外市场

今年1月,阿里云在新加坡举行AI大数据峰会,面向海外市场发布一系列AI计算及大数据产品,进一步丰富海外市场的产品密度。

围绕一系列的技术产品,阿里云在海外市场已经形成本地化的生态体系,为海外企业提供本地化服务。

周靖人透露,此次产品升级后,相关产品能力会逐渐服务海外市场。他介绍:“今天我们讲到模型能力的时候,不单单是说百炼平台,更重要的是今天在海外市场我们有多语种支持,这也是通义大模型系列非常突出的部分,特别是在东南亚地区语言上的性能得到的反馈都是非常积极的。所以这方面我们还会持续地投入。”

周靖人提到的百炼大模型平台是2023年10月对外发布的大模型,开发者可通过“拖拉拽”5分钟开发一款大模型应用,几小时“炼”出一个专属模型,把精力专注于应用创新。本次大会上,百炼升级成为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。升级后,百炼可以更好支持大型企业和成熟开发者的需求。

阿里云百炼的一大重要优势,在于最大程度的开放性和自由度。当下一些大模型应用平台采用封闭链路,不支持替换原子能力,导致企业开发应用时无法引入自研插件,和业务场景充分融合。

百炼率先兼容并优化了LlamaIndex等开源架构,拥抱社区生态,支持从本地或不同云端导入SQL、pdf、excel、ppt等各种类型数据源,还支持根据需求自由替换精细的能力组件,让AI应用丝滑嵌入企业原有业务系统。

周靖人表示,接下来,百炼将继续做对开发者最友好、最开放的大模型平台。

近年来,阿里云在海外市场增长迅速,市场规模五年增长超20倍,并持续深入本地化布局,建设当地的生态和服务体系。目前,阿里云在全球29个地域运营88个可用区。据Gartner数据,阿里云市场份额排名亚太第一,全球第三。

热门相关:盲目恋爱   Soho区惊魂夜   雷蒙·斯尼奇的不幸历险第一季   诡影实录   玻璃之花与坏掉的世界