弱智吧竟成最佳中文AI训练数据?中科院:8项测试第一
据量子位消息,百度贴吧的弱智吧竟然登上了正经AI论文,还成了最好的中文训练数据。
据悉,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。
在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。
论文中的Ruozhiba就是指百度贴吧弱智吧,一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的:
最离谱的是,弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI,这下吧友自己都闹不明白了。
其他平台围观网友也纷纷蚌埠住了:
这项研究来自中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢大学等众多高校、研究机构联合团队。
作者之一也现身评论区,透露使用弱智吧数据训练AI属于灵机一动,以前只用来测试。
原文地址>>>
热门相关:聊斋大圣人 全民女神:重生腹黑千金 大唐扫把星 大唐杨国舅 宠宠欲恋