腾讯混元开源：升级模型矩阵，云上推出256k长文模型

2024-05-17 15:58 由环球网发表于 #科技

【环球网科技报道记者李文瑶】5月17日，腾讯云对外公布大模型研发、应用产品的系列进展。据官方介绍，腾讯混元大模型能力持续升级，多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放，满足企业客户、开发者在不同场景下的模型需求，落地最优性价比模型方案。

其中，最大模型已拓展至万亿级参数规模，并在1B、3B、7B、13B等不同参数量下，均有布局。

升级后的腾讯混元，在国内率先采用混合专家模型 (MoE) 结构，模型总体性能相比上一代提升了50%，部分中文能力已追平GPT-4，在“时新”问题的回答表现上，数学、推理等能力上均有较大提升。

在腾讯云上，混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务，目前已面向企业及个人开发者全量开放。

hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型，具备单次处理超过38万字符的超长文本能力，在长文档的阅读理解和大规模数据分析方面展现出强大性能，能够为金融、医疗、教育、出行等行业的专业人士提供强有力的工作支持，显著提高工作效率。

在多模态能力方面，混元大模型也持续迭代升级。在生图领域，腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构，支持中英文双语输入及理解，具备多轮绘图能力，测评结果国内领先；在生视频领域，腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力，已经支持 16s 视频生成；在生3D层面，腾讯混元已布局文/图生3D，单图仅需30秒即可生成3D模型。

腾讯集团副总裁蒋杰宣布，腾讯混元大模型将拥抱开源。此前，混元文生图大模型已全面开源，仅3天时间就在Github上获得超千位开发者关注。多种尺寸的腾讯混元MoE模型也即将对外开源，可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布，打造大模型时代原生工具链，通过PaaS服务简化数据接入、模型精调、应用开发流程，助力企业更高效、简单地用大模型开发AI原生应用，快速接入生产场景。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示，通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施，以及强安全的模型环境，构建离产业最近的AI。

热门相关：女秘书的条件姐妹的房间关机计划悠悠故人情一个好妈妈2