新最新

股市

百科

热点
24快讯

APP下载

APP二维码

联系我们

APP二维码

OpenAI发布AI代理工具Operator：ChatGPT Pro用户可体验全新AI生产力里程碑

来源：网络作者：日期：2025-01-24 07:39:14

简洁的解释是Operator可以像人类一样使用Web浏览器。

与“提问和回答”的聊天机器人不同，人工智能代理可以在有限的人类监督下根据设置完成任务，通常被认为是人工智能生产力的下一个里程碑。在OpenAI通向通用人工智能（AGI）的五个步骤中，AI代理是继聊天机器人和推理机器人之后的第三步，也是全新的一步。

Sam Altman 表示，从周四开始，美国的 ChatGPT Pro 用户（每月支付 200 美元）将能够使用 Operator 的“研究预览版”。未来将会扩展到更多地区的Pro用户，ChatGPT Plus用户也将在几个月后能够使用。与此同时，更多的人工智能代理将在未来几周和几个月内发布。

什么是操作员？

Operator 由名为 CUA（计算机使用代理）的新模型驱动，该模型将 GPT-4o 的视觉功能与强化学习支持的高级推理功能相结合。操作员可以“查看”网页（截取屏幕截图）并使用鼠标和键盘允许的所有操作与其进行交互。如果运行过程中遇到困难，模型会调用其推理能力进行自我纠正。如果问题仍然无法解决，控制权将交还给人类。

要理解这个新事物，我们需要新鲜、生动的案例。

Operator 的界面类似于聊天机器人 ChatGPT。最大的区别在于，它调用“AI代理”来完成用户的指令。

怎么用代理看网页__怎么用代理打开网页

在演示案例中，操作员被要求预订某家酒店。用户只需在对话框中输入“为我预订今晚19点在XX酒店的餐桌”，然后AI代理会自行打开网页，进入预订网站，搜索餐厅并完成预订。

如果用户需要的时段已被预订，AI会询问“19:00的桌子已被预订，19:45的桌子还有空，您要预订吗？”

还有一个案例，用户上传了一份包含“鸡蛋、菠菜、蘑菇”等杂货的购物清单，并要求操作员在杂货购物网站上进行操作。然后AI会打开浏览器，沿着列表一一搜索，并添加到购物车中。

完成任务后，操作员告诉用户总共需要多少钱以及骑手何时交付，然后将浏览器的控制权交还给人类。

OpenAI还提醒用户，虽然Operator已经是市场上最强大的AI代理，但仍远远落后于人类。例如，在使用浏览器的基准测试中，OpenAI CUA 模型可以获得 58.1% 的分数，但人类水平可以达到 78%。因此，这项新技术仍然可能会犯错误，但将在未来几个月内继续改进。

分类： 股市

地址： http://news.lianzhou.cn/post/7157.html

标签：Pro用户 OpenAI AI代理 AI生产力里程碑 Operator

责任编辑： admin

版权声明：除非特别标注，否则均为本站原创文章，转载时请以链接形式注明文章出处。

相关文章：

GPT-4.1震撼发布：支持100万tokens上下文，OpenAI首次推出长窗口模型

OpenAI秘密开发社交网络项目，或将整合ChatGPT功能加剧与马斯克竞争

OpenAI ChatGPT图像生成新功能：被用来伪造收据？

OpenAI获软银领投400亿美元融资估值达3000亿美元创历史新高

OpenAI完成400亿美元融资 3000亿估值仅次于SpaceX

OpenAI预计2025年收入将达127亿美元，同比增长两倍

ChatGPT图像生成功能迎来历史性升级：GPT-4o模型助力更精准文生图

微软、贝莱德与马斯克xAI联手，共建300亿美元AI基础设施联盟

OpenAI发布全新开发工具和API，轻松打造智能体的秘诀

OpenAI与CoreWeave达成119亿美元五年合作协议，云服务领域重大布局

美股三大指数集体低开，道指跌0.42%，纳指跌0.22%，标普500指数跌0.31% - 最新市场动态

蝴蝶效应推出AI代理Manus早期预览版，解决复杂任务引发官网注册热潮

英伟达H20 AI芯片需求激增，DeepSeek模型推动国内公司大幅增加订单

ChatGPT上网查询与数据分析功能：提升研究报告生成效率与准确性的专业助手

微软回应市场传闻，强调800亿美元投资与创纪录增长，TD Cowen追加研报解析

OpenAI用户增长显著，ChatGPT周活跃用户达4亿，今年营收有望突破110亿美元

马斯克xAI公司发布Grok 3模型，性能超越ChatGPT及DeepSeek，免费开放使用

马斯克发布Grok 3大模型，迎战OpenAI GPT 4o，AI领域巅峰对决即将上演

发表评论取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。