弱智吧竟成最佳中文AI训练数据?中科院:8项测试第一

据量子位消息,百度贴吧的弱智吧竟然登上了正经AI论文,还成了最好的中文训练数据。

据悉,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。

在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。

论文中的Ruozhiba就是指百度贴吧弱智吧,一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的:

最离谱的是,弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI,这下吧友自己都闹不明白了。

其他平台围观网友也纷纷蚌埠住了:

这项研究来自中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢大学等众多高校、研究机构联合团队。

作者之一也现身评论区,透露使用弱智吧数据训练AI属于灵机一动,以前只用来测试。

原文地址>>>

热门相关:聊斋大圣人   全民女神:重生腹黑千金   大唐扫把星   大唐杨国舅   宠宠欲恋