腾讯宣布混元文生图大模型开源

2024-05-14 16:39 由环球网发表于 #科技

【环球网科技报道记者李文瑶】5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。

据了解，这是业内首个中文原生的DiT架构文生图开源模型，支持中英文双语输入及理解，参数量15亿。升级后的混元文生图大模型采用了与 sora 一致的DiT架构，不仅可支持文生图，也可作为视频等多模态视觉生成的基础。

升级后的混元文生图模型采用了基于Transformer的扩散模型架构（简称DiT），具备更强的可扩展性，在参数量越多的情况下，性能越强，有利于提升视觉模型生成效果及效率。这也是此前爆红的文生视频产品Sora 背后的关键技术。

腾讯文生图负责人芦清林表示：“腾讯混元文生图的研发思路就是实用，坚持从实践中来，到实践中去。此次把最新一代模型完整开源出来，是希望与行业共享腾讯在文生图领域的实践经验和研究成果，共建中文文生图开源生态，加速大模型行业发展。”

目前，腾讯混元文生图模型参数量达 15 亿。评测数据显示，最新的腾讯混元文生图模型效果相比前代提升超过 20%，远超开源的Stable Diffusion模型，在目前已开源的文生图模型中，综合性能最佳，达到国际领先水平。

热门相关：女大学生的问题扑通扑通民宿一路芬芳 NTR 裸模无颜美女

相关文章

苹果或下月在国际市场启动销售Vision Pro

而在苹果公司最新的财报中也并未透露Vision Pro具体销量，苹果CEO蒂姆·库克对此表示，“全球财富100强中有一半的公司已经购买了苹果Vision Pro阅读全文

环球智驾：长城旗下灵魂摩托品牌即将发布，创新搭载8缸发动机

据悉，灵魂摩托品牌的发布是长城汽车多元化发展战略的一部分，也标志着公司正式进军摩托车市场，意图通过技术创新和品牌差异化战略，为消费者提供全新的驾驶体验阅读全文

环球智驾：智己L6正式上市，起售价19.99万元

智己L6全系车型均配备了先进的灵蜥数字底盘，该底盘结合了智慧四轮转向系统和全数字智能管理中枢，为用户提供了灵活、舒适且安全的驾驶体验阅读全文

环球视角：OpenAI推出新一代AI模型GPT-4o

此外，OpenAI还宣布，GPT-4o与ChatGPT Plus会员版的所有功能，包括视觉、联网、记忆、执行代码以及GPT Store等，将对所有用户免费开放，阅读全文

苹果iPad mini 7或将于年底亮相

尽管市场普遍认为这款8.3英寸的小型平板电脑亟待升级，但根据彭博社记者马克·古尔曼的报道，粉丝们可能还需等待一段时间才能迎来第七代iPad mini阅读全文

Anthropic推出Claude聊天机器人欧洲市场迎来新智能助手

【环球网科技综合报道】人工智能初创公司Anthropic正式宣布，于本周二在欧洲发布其生成式人工智能聊天机器人Claude阅读全文

环球视角：索尼游戏业务领导层大换血

此次领导层的调整，正值索尼面临改善PlayStation 5游戏机背后的游戏业务利润率的压力之际阅读全文

vivo旗舰新机X100 Ultra发布，首搭汇顶科技自主研发超声波指纹技术

在发布会上，vivo还推出了X100s系列手机，该系列则采用了汇顶科技的屏下光学指纹和AMOLED触控技术阅读全文

康佳发布天镜Mini AI-LED电视旗舰新品，搭载AI ERA人感大模型

为还原用户的真实感知，A8 Pro搭载AI ERA人感影像大模型，对海量数据进行深度训练，在数十项AI的先进算法下，智能识别并逐帧调校画面的细微参数，让用户看到阅读全文

iOS 18将在语音备忘录和备忘录应用中加入新的音频转录功能

根据AppleInsider获得的信息，iOS 18将在语音备忘录和备忘录应用中加入新的音频转录功能。该报道称，iOS 18上的语音备忘录和备忘录应用都将提供录音的转录。此外，备忘录应用显然能够提供人'......阅读全文