苹果研究人员开发了一种训练大型语言模型的新方法

2024-03-20 09:02 由威锋网发表于 #科技

可以无缝地整合文本和视觉信息。

苹果公司的研究人员开发了一种训练大型语言模型(LLM)的新方法，可以无缝地整合文本和视觉信息。

该公司的发现详细载于一篇题为《MM1：多模式LLM预训的方法、分析和见解》的研究论文中，展示了一种创建更智能、更灵活的人工智能系统的新方法。苹果公司声称，通过利用包括图像-字幕对、交错的图像-文本文档和纯文本数据在内的各种数据集，MM1模型为人工智能高精度执行图像字幕、视觉问题回答和自然语言推理等任务的能力设定了新的标准。

苹果的研究重点是不同类型的训练数据和模型架构的组合，这使人工智能能够理解并基于视觉和语言线索生成语言。这种能力对于需要对世界有细微差别的理解的任务至关重要，例如解释复杂的图像或回答涉及视觉元素的问题。

文章还强调了MM1模型在上下文中的卓越学习能力，特别是在该模型的最大300亿参数配置中。这个版本显然展示了非凡的能力，可以使用极少的“思维链”提示在多个图像上进行多步推理，这是一种允许人工智能基于最少的例子执行复杂的开放式问题解决的技术。

【以上内容转自“威锋网”，不代表本网站观点。如需转载请取得威锋网许可，如有侵权请联系删除。】

延伸阅读：

消息称苹果iOS18或将引入大模型
苹果也要入局大模型？消息称苹果聊天机器人产品已在推进

热门相关：误踩老公底线：甜心难招架！大文豪世界第一校长灭世魔帝恐怖复苏

相关文章

境外游客玩转11个中外“支付宝” 沪上入境移动支付涨13倍

3大境外“支付宝”入境消费量最大目前，通过Alipay+跨境支付服务，直接来华可扫码支付的10个境外“支付宝”包括：AlipayHK（中国香港特别行政区）、To阅读全文

华为伙伴大会2024数字政府数据要素论坛成功举办

在数据要素市场化体系中，已经形成了公共数据授权运营、行业数据空间、企业数据交换等三类典型的数据要素流通场景。阅读全文

蚂蚁集团启动组织升级，任命韩歆毅为集团总裁

【环球网科技报道记者李文瑶】3月19日，记者从蚂蚁集团方面获悉，蚂蚁集团董事长兼CEO井贤栋发布全员信，宣布新一轮组织架构升级：韩歆毅将出任蚂蚁集团总裁，全阅读全文

同程旅行发布2023年财报：年度付费用户达2.35亿，较2019年增54%

财报显示，公司全年实现收入118.96亿元，经调整净利润21.99亿元。阅读全文

菜鸟联手速卖通升级跨境物流 “全球5日达”增开欧美中东核心市场

菜鸟联合速卖通升级跨境物流，增设德、法、葡、沙特、美、墨等市场，推广“全球5日达”。阅读全文

世界首款！英伟达重磅发布人形机器人模型

这一创新成果不仅标志着英伟达在人工智能领域的又一重大突破，更预示着人形机器人将成为未来AI发展的新热点阅读全文

华为家庭绿电携手豪宅设计大师，揭秘未来零碳豪宅引关注

他们为众多别墅用户提供了光储一体的清洁能源解决方案，不仅满足了这些家庭对能源独立自主的需求，还让他们能够在享受品质生活的同时，积极践行低碳环保的理念阅读全文

华为与伙伴共探全光网络“三进三退”千亿新机遇

谷云波解释称，fgOTN，它的英文是小颗粒的OTN，是去年年底在ITU-T发布的标准，这是光产业在政企领域非常成熟的应用场景，例如在电力、能源等行业中生产控制网阅读全文

通义听悟功能升级：上线音视频问答助手，还会做思维导图

阿里大模型产品“通义听悟”升级上新六大功能，包括音视频问答助手“小悟”，支持超长音视频自由问答，一键AI改写等。同时推出“高校公益计划”。阅读全文

美团宣布新一轮轮岗计划提拔三位业务负责人

美团内部信宣布新一轮业务负责人轮岗任命，副总裁魏巍负责到店餐饮事业部，章若愚接任外卖履约平台负责人，薛冰成为外卖事业部负责人。阅读全文