腾讯混元开源:升级模型矩阵,云上推出256k长文模型
【环球网科技报道 记者 李文瑶】5月17日,腾讯云对外公布大模型研发、应用产品的系列进展。据官方介绍,腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。
其中,最大模型已拓展至万亿级参数规模,并在1B、3B、7B、13B等不同参数量下,均有布局。
升级后的腾讯混元,在国内率先采用混合专家模型 (MoE) 结构,模型总体性能相比上一代提升了50%,部分中文能力已追平GPT-4,在“时新”问题的回答表现上,数学、推理等能力上均有较大提升。
在腾讯云上,混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务,目前已面向企业及个人开发者全量开放。
hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力,在长文档的阅读理解和大规模数据分析方面展现出强大性能,能够为金融、医疗、教育、出行等行业的专业人士提供强有力的工作支持,显著提高工作效率。
在多模态能力方面,混元大模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持 16s 视频生成;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。
腾讯集团副总裁蒋杰宣布,腾讯混元大模型将拥抱开源。此前,混元文生图大模型已全面开源,仅3天时间就在Github上获得超千位开发者关注。多种尺寸的腾讯混元MoE模型也即将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。
腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业更高效、简单地用大模型开发AI原生应用,快速接入生产场景。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。