谷歌审核人员抱怨:无法判断Bard内容正确与否

4月6日消息,谷歌近日推出了聊天机器人Bard,并呼吁公司员工进行内部测试,同时也委托了许多外包进行评估。然而,一些外包人员抱怨称,他们根本没有足够的时间来验证Bard的答案是否正确,最终只能凭借猜测。

据网易科技报道,目前,跨国AI训练数据服务公司Appen正在帮助改进谷歌的聊天机器人。虽然这些人没有被明确告知他们被分配的任务与Bard有关,但是关于新任务的内部讨论可以追溯到 2月7日,也就是在谷歌首次发布Bard当天。Appen内部文件显示外包人员需要审查AI聊天机器人所提供的回应质量。

这些外包人员通常会帮助评估谷歌搜索算法和搜索结果中广告的相关性,还会标记有害网站,使得这些网站不会出现在搜索结果中。

四名接受采访的外包人员表示,自1月份以来,他们的大部分工作已经转向审查 AI聊天机器人的提示。在评估过程中,外包人员对聊天机器人的表现感到失望,并称他们没有足够时间准确评估聊天机器人对提示的响应是否正确,有时只能凭借猜测。不过他们仍然可以拿到报酬。

外包人员表示,他们被设定固定的时间来完成每项任务。审查提示的任务时间从60秒到几分钟不等,差异很大。这些人承认,如果他们不熟悉聊天机器人谈论的话题,比如区块链等技术,就很难给AI的回应评分。

但由于每项任务都有固定报酬,一些外包人员表示,即使意识到自己无法准确评估聊天机器人的反应,他们也会尽力完成任务。

热门相关:帝少的专属:小甜心,太缠人   致灿烂的你   仗剑高歌   网游之逆天飞扬   天启预报