阿里云发布通义千问2.5 理解、逻辑推理等能力提升

2024-05-09 13:41 由环球网发表于 #科技

【环球网科技综合报道】5月9日，阿里云正式对外发布通义千问2.5。相比通义千问2.1版本，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。同时，原通义千问APP宣布更名为“通义APP”，将通义大模型全套能力集于一身，致力于成为“通情达义”的全能AI助手。

目前，通义APP拥有超强文档处理能力，单次可处理多达1000万字的长文档，还能同时解析100份不同格式的文档，是金融、法律、科研、医疗、教育等领域专业人士的工作提效利器；基于通义大模型出色的音视频理解能力，通义APP能够精准高效地进行音视频文件的识别理解、摘要总结、多语言翻译，可同时上传处理50个音视频文件；通义APP还集成了国内最受欢迎的智能编码助手通义灵码，能帮助所有人随时随地在手机上写代码、读代码、学习编程技能。

今年以来，通义APP先后推出了“全民舞王”“全民唱演”“通义照相馆”、AI智能体等现象级应用，在“全民舞王”频道，用户上传一张照片就能跳“科目三”等舞蹈；在“全民唱演”频道，用户用一段音频就能驱动肖像照中的人物唱歌说话。这些热门应用背后都是通义实验室自研的前沿AI模型，未来，通义APP还将推出更多以新技术驱动的新玩法

当天，通义还发布了最新款开源模型，1100亿参数的Qwen1.5-110B，该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型。

通义的多模态模型和专有能力模型也受到行业关注，通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V，目前已在多家企业落地应用；通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手，还是国内用户规模第一的智能编码助手通义灵码的底座。

通义大模型问世一年多来，已经发展出了文生图、智能编码、文档解析、音视频理解等能力，企业客户和开发者可以通过API调用、模型下载等方式接入通义，个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。

“开发者的反馈和开源社区的生态支持，是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露，未来通义大模型还会持续开源。