苹果发布语言模型OpenELM：基于开源训练和推理框架

2024-04-25 19:23 由环球网发表于 #科技

【环球网科技综合报道】4月25日消息，苹果公司于日前发布一个名为OpenELM的高效语言模型，具有开源训练和推理框架。

苹果方面表示，“大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此，我们发布了 OpenELM。”

据介绍，OpenELM使用分层缩放策略，可以有效地分配Transformer模型每一层的参数，从而提高准确率。例如，在参数量约为10亿的情况下，OpenELM与OLMo 相比准确率提升了2.36%，同时所需的预训练 tokens 数量为原来的50%。

“与以往只提供模型权重和推理代码并在私有数据集上进行预训练的做法不同。”苹果官方指出，“我们发布的版本包含了在公开数据集上训练和评估语言模型的完整框架，包括训练日志、多个检查点和预训练配置。我们还发布了将模型转换为 MLX 库的代码，以便在苹果设备上进行推理和微调。此次全面发布旨在增强和巩固开放研究社区，为未来的开放研究工作铺平道路。”

据悉，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github库中获取。

热门相关：全民女神：重生腹黑千金惊悚乐园军少夜宠：小甜妻，乖！盖世双谐医道至尊

相关文章

“上视频号，看北京车展” 易车联合腾讯构建汽车内容生态新格局

4月25日，2024（第十八届）北京国际汽车展览会（以下简称 2024 北京车展）正式拉开帷幕。中国头部的汽车互联网企业易车携手腾讯，开展深度联合报道。阅读全文

好看又有实力，这才是女性喜欢的高性能AI超轻薄旗舰呀！

轻薄本一向是笔记本里各大品牌厂商的必争之地，可是，对于女性的痛点却没有精准把握到，特别是年轻女性，不仅追求实用性，更希望随身携带的产品更加具有时尚与品位，成为自己的精致助手。而首款女性高性能AI超轻薄阅读全文

为何iPhone在美国市场激活份额跌至六年新低

【环球网科技综合报道】据外媒4月25日报道，市场研究机构CIRP日前发布报告指出，iPhone在美国市场的激活份额已跌至六年来的新低阅读全文

日本横须贺市利用AI打造英语流利的虚拟市长

【环球网科技综合报道】4月25日消息，据日媒报道，日本神奈川县横须贺市近日开始了一项最新尝试，使用人工智能（AI）创建市长上地克明的虚拟分身，并让其用流利的英语阅读全文

供应链消息称Apple Watch将采用新型材料

【环球网科技综合报道】4月25日，根据供应链消息，新一代Apple Watch有望采用一种革新性材料——树脂涂布铜皮，以此为其内部构造带来显著的变革，消息称预计阅读全文

895件(套)三峡出土文物在重庆展出

2024年4月24日，由重庆中国三峡博物馆、重庆市文物考古研究院联合主办的《妙手匠心重现华光——三峡出土文物保护利用展》正在重庆中国三峡博物馆展出阅读全文

探馆2024中关村论坛：科技感与环保意识成关键词

今年，论坛年会有大量AIGC模型接入的应用场景和设备，拥有智慧“大脑”的仿生人形机器人、裸眼3D空中成像技术机器人、超写实数字人、智能咖啡机器人、智能刺绣机器人阅读全文

高通副总裁Chris Longman：致力于为知识产权领域国际对话与合作做出贡献

4月23日，2024中国知识产权保护高层论坛在京举办。高通公司副总裁及法律顾问克里斯·朗曼（Chris Longman）参会并做主旨演讲。阅读全文

GE Vernova拆分后首发声：以“能源变革之力”为中国高质量发展作贡献

日前，GE Vernova 在其中国区总部举行了拆分之后的首次媒体沟通会，就其发展目标以及在中国能源市场的发展情况等与媒体进行了沟通。阅读全文

欧盟实施新维修权规则，鼓励设备修复而非替换

新规则还强调，公司必须以“合理”的价格提供维修服务，以防止因高昂的维修费用而阻碍消费者选择修复产品阅读全文