面壁智能宣布开源 MiniCPM-V 2.6 模型，端侧AI多模态能力增强

2024-08-07 11:32 由环球网发表于 #科技

【环球网科技综合报道】8月7日消息，人工智能公司面壁智能宣布正式开源其最新的端侧AI多模态模型——MiniCPM-V 2.6。官方称 MiniCPM-V 2.6 模型仅 8B 参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩。

据面壁智能官方介绍，MiniCPM-V 2.6 模型在多项功能上实现了首次在端侧的部署，包括实时视频理解、多图联合理解、多图ICL（上下文少样本学习）视觉类比学习、多图OCR等。这些功能的加入，使得端侧模型能够更贴近复杂的真实世界场景，充分发挥其传感器富集、贴近用户的优势。

据介绍，在模型效率与性能方面，MiniCPM-V 2.6模型具有极高的像素密度（Token Density），比GPT-4o的单token编码像素密度高两倍，从而在端侧设备上实现了极高的运行效率。量化后的模型仅需6GB内存，端侧推理速度高达每秒18个token，比上代模型快33%。此外，该模型还支持多种语言和推理框架，进一步提升了其应用的广泛性和灵活性。

值得一提的是，MiniCPM-V 2.6 模型在OCR能力上也延续了其一贯的SOTA性能水平，并进一步覆盖到单图、多图、视频理解等多个场景。通过统一的高清视觉架构，该模型将OCR能力进行迁移和知识共享，实现了从单图到多图及视频的流畅拓展，显著节省了视觉token的数量和资源消耗。

目前，MiniCPM-V 2.6 模型的开源地址已经公布在GitHub和HuggingFace平台上。

热门相关：来自地狱的男人神话版三国黄金渔场穹顶之上完美再遇

相关文章

携手WPS 365，连城集团实现数字化转型新飞跃

借助 WPS 365，连城集团在云上建立了团队文档库，实现了团队生产的所有文档、表格等的统一存储和管理。阅读全文

2024年上半年全球储能电芯出货量达114.5 GWh，同比增长33.6%

【环球网科技综合报道】8月7日消息，新能源研究机构 InfoLink Consulting最新报告显示，2024年上半年，全球储能电芯出货量达到114.5吉瓦时阅读全文

壹沓科技完成B+轮融资，加速大模型领域研发与布局

本轮融资由鼎晖VGC（创新与成长基金）领投，新尚资本跟投，指数资本担任独家财务顾问，为壹沓科技在大模型领域的进一步研发和布局注入了强劲动力阅读全文

罗技国际任命Matteo Anversa为新任首席财务官

【环球网科技综合报道】8月7日，据路透社消息，全球知名的电脑配件制造商罗技国际（LOGN.S）于近日宣布，已正式任命Matteo Anversa为公司首席财务官阅读全文

环球视角：谷歌反垄断裁决或引发苹果200亿美元风险

华尔街分析师指出，谷歌为避免反垄断处罚，可能不得不终止与苹果的合作协议，该协议使谷歌搜索引擎成为苹果设备上的默认选项阅读全文

搭载 M4 芯片的新款 Mac 仍有望在今年晚些时候推出

在他的 Power On 新闻通讯中，Mark Gurman 重申，搭载 M4 芯片的新款 Mac 机型仍有望在今年晚些时候推出，不过有一个有趣的新细节。Gurman 还补充说，MacBook Air'......阅读全文

华为FreeBuds 6i发布：从参数到体验，重新诠释TWS降噪耳机的竞争力

在这个以参数为王的时代，华为FreeBuds 6i正在以实际行动证明：一味追求最大降噪深度并不能带来真正的用户体验提升阅读全文

将折叠屏打入年轻市场，华为nova Flip书写科技潮品新范式

从预热到亮相，华为nova Flip以其独特的美学设计、前沿的技术应用和深入的品牌理念，让这款手机成为了年轻人手中的时尚玩物，也让折叠屏机型这种高端机型开始向年阅读全文

华为MatePad Pro 12.2正式发布，硬件与软件创新重新定义平板生产力

作为华为平板的高端旗舰产品，华为MatePad Pro系列一直致力于推动平板行业创新，此次全新升级的MatePad Pro 12.2英寸和天生会画App正式版，阅读全文

享界S9正式发布：首发多项创新技术重塑豪华智慧出行

前向主动安全场景再升级以及侧向主动安全辅助避险和后向主动安全倒车更安全等设计都使得享界S9在驾驶安全方面更加出色阅读全文