OpenAI发布AI代理工具Operator:ChatGPT Pro用户可体验全新AI生产力里程碑
简洁的解释是Operator可以像人类一样使用Web浏览器。
与“提问和回答”的聊天机器人不同,人工智能代理可以在有限的人类监督下根据设置完成任务,通常被认为是人工智能生产力的下一个里程碑。在OpenAI通向通用人工智能(AGI)的五个步骤中,AI代理是继聊天机器人和推理机器人之后的第三步,也是全新的一步。
Sam Altman 表示,从周四开始,美国的 ChatGPT Pro 用户(每月支付 200 美元)将能够使用 Operator 的“研究预览版”。未来将会扩展到更多地区的Pro用户,ChatGPT Plus用户也将在几个月后能够使用。与此同时,更多的人工智能代理将在未来几周和几个月内发布。
什么是操作员?
Operator 由名为 CUA(计算机使用代理)的新模型驱动,该模型将 GPT-4o 的视觉功能与强化学习支持的高级推理功能相结合。操作员可以“查看”网页(截取屏幕截图)并使用鼠标和键盘允许的所有操作与其进行交互。如果运行过程中遇到困难,模型会调用其推理能力进行自我纠正。如果问题仍然无法解决,控制权将交还给人类。
要理解这个新事物,我们需要新鲜、生动的案例。
Operator 的界面类似于聊天机器人 ChatGPT。最大的区别在于,它调用“AI代理”来完成用户的指令。
在演示案例中,操作员被要求预订某家酒店。用户只需在对话框中输入“为我预订今晚19点在XX酒店的餐桌”,然后AI代理会自行打开网页,进入预订网站,搜索餐厅并完成预订。
如果用户需要的时段已被预订,AI会询问“19:00的桌子已被预订,19:45的桌子还有空,您要预订吗?”
还有一个案例,用户上传了一份包含“鸡蛋、菠菜、蘑菇”等杂货的购物清单,并要求操作员在杂货购物网站上进行操作。然后AI会打开浏览器,沿着列表一一搜索,并添加到购物车中。
完成任务后,操作员告诉用户总共需要多少钱以及骑手何时交付,然后将浏览器的控制权交还给人类。
OpenAI还提醒用户,虽然Operator已经是市场上最强大的AI代理,但仍远远落后于人类。例如,在使用浏览器的基准测试中,OpenAI CUA 模型可以获得 58.1% 的分数,但人类水平可以达到 78%。因此,这项新技术仍然可能会犯错误,但将在未来几个月内继续改进。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。