腾讯蒋杰:混元大模型已在沟通、生产、科技普惠多个场景落地
11月9日消息,“腾讯正在持续探索大模型应用场景,目前内部超180项业务已经接入腾讯混元大模型进行内测”,11月9日,腾讯集团副总裁蒋杰在2023年世界互联网大会乌镇峰会上表示。
腾讯集团副总裁 蒋杰
作为腾讯全链路自研的实用级大模型,自2023年9月首次面向公众亮相以来,腾讯混元大模型在内部业务的应用不断深化,同时在文化沟通、生产提效、科技普惠多个领域探索落地场景,发掘应用价值。
在文化沟通方面,腾讯混元大模型的多语种翻译以及最新的文生图、文生3D等能力,可以有效增进沟通,帮助跨文化背景的人更好地交流。例如,通过腾讯混元,人们可以便捷地使用英文和法语等语言,向外国朋友介绍汉服的历史和特征,辅以AI生成的图片,以及3D立体的呈现,让整个介绍和沟通更准确、生动,更高效。
在生产效率方面,腾讯混元大模型应用在专业设计场景中,可显著提升素材创作生产效率。据介绍,当前腾讯内部各类设计需求中,90%的角色、场景、地图等原画创作都可由腾讯混元辅助生成。
同时,基于腾讯混元的能力,超过99%的logo可以通过AI设计。在广告业务中,通过腾讯混元“文生图”,可以高效创作广告素材,让创作效率提升10倍以上,在提供更多创意素材的同时降低设计成本。
在科技普惠方面,腾讯混元大模型正在通过强大的知识储备能力服务对应场景,例如,在医疗领域,大模型可以成为医生的小助手,通过智能导诊迅速了解患者需求,帮助他们找到合适科室或者其他专业的医疗服务。
此外,借助大模型丰富的医学知识,可以为医生和患者提供医疗问答支持,答疑解惑。未来随着图像处理能力的加入,大模型还可协助识别各类医学影像,成为放射科医生的助手。
现场,蒋杰也展示了腾讯混元大模型的“文生视频”能力,围绕“全球沟通纽带”、“连接、高效与共享”、“一带一路”等关键词,腾讯混元大模型生成了一段体现全球人类友好交往主题的视频,包含高铁、广州塔、机器人、汉服等多个画面,展示了领先的视频生成技术水平。通过大模型来生成视频画面,可以大大降低创作门槛,未来,这一技术也有望被广泛应用在跨文化沟通、生产提效以及科技普惠各个领域,带来新的应用和想象空间。
长期以来,腾讯坚持“技术为应用服务”的理念,以技术创新为核心动力,通过融合场景推动人工智能的研究与实践,不断将人工智能技术运用到不同场景中,促进社会发展。
蒋杰介绍,腾讯在人工智能领域深耕多年,建立了四大AI实验室,涉及从全面基础研究到多种应用开发多个环节,同时还建立了前沿科技探索的实验室矩阵,涵盖机器人、量子计算、生命科学等,打造面向未来的“科技引擎”。
在人工智能领域,腾讯拥有丰富的积累。2011年,腾讯已开启语音领域探索,在语音识别、语音合成、声纹识别方面有所突破。2012年起,腾讯开展图像识别研究,将相关成果广泛应用到各行业中,最近,腾讯还推出“刷掌支付”,基于自研的掌纹特征提取与识别技术,增加了支付方式的选择。
此外,2016年开始,腾讯在强化学习与智能决策方向不断取得突破,在国际顶级学术会议发表多篇论文,并将成果应用于游戏AI、医疗和机器人等多个领域。2021年开始,腾讯相继推出了千亿和万亿参数的NLP大模型。2023年9月7日,腾讯混元大模型正式对外亮相,拥有更强大的文本能力及多模态理解和生成能力。
腾讯混元大模型已具备成为数字引擎的关键能力,2023年恰逢乌镇互联网峰会十周年,也是“一带一路”倡议提出十周年,蒋杰表示,人工智能技术具有无限潜力。