阿里云发布通义千问2.5 理解、逻辑推理等能力提升
【环球网科技综合报道】5月9日,阿里云正式对外发布通义千问2.5。相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。同时,原通义千问APP宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的全能AI助手。
目前,通义APP拥有超强文档处理能力,单次可处理多达1000万字的长文档,还能同时解析100份不同格式的文档,是金融、法律、科研、医疗、教育等领域专业人士的工作提效利器;基于通义大模型出色的音视频理解能力,通义APP能够精准高效地进行音视频文件的识别理解、摘要总结、多语言翻译,可同时上传处理50个音视频文件;通义APP还集成了国内最受欢迎的智能编码助手通义灵码,能帮助所有人随时随地在手机上写代码、读代码、学习编程技能。
今年以来,通义APP先后推出了“全民舞王”“全民唱演”“通义照相馆”、AI智能体等现象级应用,在“全民舞王”频道,用户上传一张照片就能跳“科目三”等舞蹈;在“全民唱演”频道,用户用一段音频就能驱动肖像照中的人物唱歌说话。这些热门应用背后都是通义实验室自研的前沿AI模型,未来,通义APP还将推出更多以新技术驱动的新玩法
当天,通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型。
通义的多模态模型和专有能力模型也受到行业关注,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。
通义大模型问世一年多来,已经发展出了文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。
“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露,未来通义大模型还会持续开源。