蚂蚁发布金融大模型:两大应用产品将在完成备案后上线
9月8日消息,9月8日,在上海举办的外滩大会上,蚂蚁集团正式发布金融大模型。据了解,蚂蚁金融大模型基于蚂蚁自研基础大模型,针对金融产业深度定制,底层算力集群达到万卡规模。
该大模型聚焦真实的金融场景需求,在“认知、生成、专业知识、专业逻辑、合规性”五大维度28类金融专属任务中表现突出,在“研判观点提取”“金融意图理解”“金融事件推理”等众多领域达到行业专家水平。目前,蚂蚁金融大模型已在蚂蚁集团的财富、保险平台上全面测试。
当天,蚂蚁集团同时发布了基于金融大模型能力的两款产品:智能金融助理“支小宝2.0”,服务金融产业专家的智能业务助手“支小助”,展示了蚂蚁从基础大模型到行业大模型以及产业应用的全栈布局和进展。
其中,“支小宝2.0”已内测近半年,将在完成相关备案工作后上线。“支小助”正在与蚂蚁平台合作机构内测共建,为理财顾问、保险代理、投研、金融营销、保险理赔等金融从业专家打造全链条的AI业务助手。
本次发布会上,蚂蚁也开放了金融专属任务评测集“Fin-Eval”,该测试集从五大维度28个分类评估了金融大模型能力,填补了高质量综合性评测集的行业空缺。
注入千亿量级Token金融知识,重在规模化产业应用
蚂蚁集团副总裁、金融大模型负责人王晓航介绍,基于金融场景中的大量实践,蚂蚁金融大模型形成了“大模型+知识+服务”驱动的架构,这套架构已经在蚂蚁内部金融智能化场景上内测。
知识力方面,据介绍,蚂蚁金融大模型在万亿量级Token的通用语料基础上,注入千亿量级Token金融知识,并从300+真实产业场景中提取了共60万+高质量指令数据,形成了金融专属任务性能优化的优势数据资产。
专业力方面,得益于蚂蚁长达十年的积累,平台上有完备的数字化金融工具矩阵,蚂蚁金融大模型可通过理解用户语言,精准调用蚂蚁体系内的这些专业工具,给用户提供相应专业服务,理财侧包括理财选品、产品评测、行情解读、资产配置等6大类服务,保险侧包括产品解读、家庭配置、智能核保、智能理赔等10多个智能服务。
针对内容生成的安全可控问题,蚂蚁金融大模型采用意图识别与事实性校验相结合的方式,有效提升了生成内容的合规性、安全性和真实性。
为了系统化评估AI在金融领域的表现,蚂蚁从真实金融场景定义了金融AI任务评测集“ Fin-Eval”。Fin-Eval代表真实产业场景需求,是目前覆盖最广、专业性最深的金融智能领域评测集,由“认知、生成、领域知识、金融逻辑、安全合规”五大维度共28个分类组成。在本次外滩大会上,蚂蚁集团也正式对外开放Fin-Eval,希望促进行业技术共同进步。
王晓航判断,大模型正在为金融产业带来体验变革:更自然的交互,更丰富的供给,更有效的表达,更贴身的服务定制,更高效的服务。“金融业务链条上每一个关键职能,都值得用大模型技术重做一次。”
据了解,8月底,蚂蚁金融大模型已通过证券从业资格、保险从业资格、执业医师资格、执业药师资格等专业试题测试。
目前,蚂蚁金融大模型已率先在理财和保险领域进行应用测试。未来,蚂蚁集团与金融机构合作的所有数字金融业务将全线接入这一大模型,助力合作机构数字化升级、智能化转型。
发布两大产品:2C的“支小宝2.0”和2B的“支小助1.0”
当天,蚂蚁集团也发布了首个基于金融大模型的应用产品—智能金融助理“支小宝2.0”,以及面向金融行业专家的智能业务助手 “支小助1.0”,展示了蚂蚁在大模型领域从技术到行业应用的全栈布局和进展。
据介绍,“支小宝2.0”在语言力、知识力、专业力、安全力四方面性能突出,可为用户提供高质量的行情分析、持仓诊断、资产配置和投教陪伴等专业服务。
“支小宝2.0”具备高精度的意图理解,个性化的沟通风格:金融意图识别准确率达到95%,金融事件分析推理能力不逊于真人行业专家,能够进行多回合的高质量对话。
智能业务助手“支小助”的1.0版本,则包含了“服务专家版”、“投研专家版”、“理赔专家版”、“保险研究专家版”等六个版本,全方位服务不同金融场景的从业人员,可在投研分析、信息提取、专业创作、商机洞察、金融工具使用等环节提供深度智能服务。
以“投研支小助”为例,实测数据显示,支小助每日可辅助每位投研分析师高质量地完成超过100+篇研报和资讯的金融逻辑和观点提取,40+金融事件的推理和归因,分析效率倍增。
同时,支小助可基本替代基础的金融工程代码编写,带来量化研究效率的大幅提升。在“服务支小助”的辅助下,理财顾问和保险代理人的有效管户半径人均可扩大70%以上。
据了解,支小宝2.0已经内测近半年,待完成备案工作即可上线。支小助则正与蚂蚁平台的合作机构内测共建,待成熟后向蚂蚁平台上的合作机构正式开放。
据介绍,8日发布的蚂蚁金融大模型基于蚂蚁基础大模型,针对金融产业深度定制。蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平,为大模型产业化应用提供有力支撑。