环球视角:OpenAI推出新一代AI模型GPT-4o
【环球网科技综合报道】北京时间5月14日凌晨,全球领先的AI研究公司OpenAI通过一则简短的视频介绍,正式发布了其最新一代的AI模型GPT-4o。这一模型实现了音频、视觉和文本推理的实时交互,标志着人工智能技术的又一重要进步。
GPT-4o的名称中“o”代表Omni,即全能的意思,凸显了其多功能的特性。相较于去年11月推出的GPT-4-turbo,GPT-4o在性能上有了显著的提升。据OpenAI介绍,GPT-4o在处理速度上提升了高达200%,同时在价格上也实现了50%的下降,使得更多用户可以享受到先进AI技术带来的便利。
值得一提的是,GPT-4o还将在未来几周内推出语音和视频输入功能,这将进一步提升用户与AI模型的交互体验。此外,OpenAI还宣布,GPT-4o与ChatGPT Plus会员版的所有功能,包括视觉、联网、记忆、执行代码以及GPT Store等,将对所有用户免费开放,这无疑将大大降低用户使用先进AI技术的门槛。
在发布会上,OpenAI的联合创始人兼总裁格雷格·布罗克曼展示了GPT-4o的强大功能。他通过一段5分钟的对话,展示了新版ChatGPT如何通过视觉AI能力理解摄像头中的内容,并通过语音与旧版ChatGPT进行交互。这种交互方式不仅丰富有趣,还支持中途打断和对话插入,同时具备了上下文记忆能力。
OpenAI的CEO萨姆·奥尔特曼对GPT-4o给予了高度评价,称其为OpenAI有史以来最好的模型。他表示:“新的GPT-4o模型很智能,速度很快,是原生多模态,并且可供所有ChatGPT用户使用,无论是免费版本还是付费GPT-4版。”他还强调了OpenAI的使命,即将优秀的AI工具交到每个人手中。
然而,对于GPT-4o的发布,业内专家也提出了一些质疑。有专家指出,尽管GPT-4o在多模态能力上有所提升,但OpenAI并未展示出真正的视觉多模态突破功能。此外,在实时音频交互方面,市场上已有其他产品具备了类似的功能。