APP下载
APP二维码
联系我们
APP二维码
返回

智谱推出免费Agent产品沉思,多能力上线且无需邀请码

来源:网络   作者:   日期:2025-04-03 10:19:11  

在许多地方与国有资产合作之后,大型模型Unicorn Zhipu迎来了其产品的新进展。

最近,Zhipu推出了代理产品“ AutoGlm沉思”(以下简称“沉思”),该产品具有深刻的思维和操作执行能力,并已免费启动。据报道,“沉思”可以查看不向公众开放的CNKI,Xiaohongshu,官方帐户,Juchao信息等,同时,它具有多模式的理解能力,并且可以在网页上理解图形信息。

Zhipu首席执行官Zhang Peng在引入“沉思”时说:“该代理商不花39美元,它是免费的,不需要邀请代码。”以前,国内智能制造商的手动已经引发了有关AI代理商的讨论浪潮,但是由于邀请代码的分布有限,大多数用户只能拭目以待,无法真正体验它。

在实际测试中,“科学与创新委员会日报”的记者发现,“沉思”表明了通过从理解和解散问题并结合信息检索来快速在思维过程中构建解决方案框架的能力。

智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_

记者对“沉思”的实际考验

科学技术创新委员会每日的记者使用“沉思”来测试七个任务,所有这些任务都完成了,并提供了三个示例以显示其推理过程。

任务1:我需要从4月20日至27日北京进行为期7天的欧洲行程,预算为30,000至80,000元,这适合我和我最好的朋友。我们喜欢感兴趣的地方,隐藏的宝藏和欧洲文化,需要一个特殊的历史地点才能推荐。请提供详细的旅行手册,其中包含地图,景点,必要的外语短语和旅行技巧,供我们参考。

智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_

智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_

任务2:在Yuetan附近推荐肯德基外卖。

智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_

智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_

智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_

任务3:我总是被提醒我打扮一些学生启发。现在,我准备进入工作场所并开始学习改变自己。顺便说一句,我开设了一个Douyin帐户,以记录自己的变化过程并成为培训博客作者。第一期的标题称为“听第一天”,请帮助我写一个视频脚本。

_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!

智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_

_智谱携“沉思”加入Agent“混战” 记者实测结果来了!_智谱携“沉思”加入Agent“混战” 记者实测结果来了!

任务:一旦代理完成高度定制的旅行计划,它就会由专业旅行计划者完成。可以看出,“冥想”迅速开放了相关门票购买和酒店预订的网站,并进行了一系列分析,并提供了数千个单词的详细报告。

在任务2中,“沉思”比较了Yuetan附近的主要商店的位置,商店特征,交付和外卖服务在不同平台等上的价格,并生成详细的表格和报告。

在第三个任务中,“沉思”一直在寻找许多网站,例如Zhihu,Sina,Sohu等,并迅速生成了Douyin视频脚本,具有很高的文学水平和完整。

总体感觉是,“沉思”的执行非常快,甚至可以开放许多用户自己的盲点网站,这可以大大节省时间和决策成本。

但是,一些用户还告诉《科学与创新委员会日报》的记者,与搜索时思考相比,深思熟虑的模型产品的更重要功能是在思考时聊天和思考。在每个思维的节点上,用户都可以及时参与互动和正确的模型操作,以防止模型执行不必要甚至错误的思维行为和操作。

代理的申请表也将返回到模型

随着代理商爆炸的继续接近,代理的实施方法和最终形式也已成为当前AI从业者辩论的重点。以前,Pleias的联合创始人Alexander Doria提到,AI代理的未来开发方向是模型本身,而不是工作流程,并以Manus为例,认为其及时的驱动程序无法完成复杂的任务。

张彭对《科学与创新委员会日报》的记者说,他的观点基本上与亚历山大·多里亚(Alexander Doria)一致。 “将来的新申请表,尤其是代理的应用形式仍将返回模型。这也是模型的概念,即我们一直在提倡的场景。将来,许多应用程序将集中在模型上,并包括非常浅或薄的壳体,并应用了一个基于产品的外壳,并应用了产品,这将成为产品。一旦模型能力提高了产品的应用程序,就可以改进。

“但是,当前的AGI道路刚刚开始,模型的能力无法达到完全类似于人类的水平。模型的能力是有限的,并且需要通过实际的应用问题来解决工程。它始终是模型的进步和工程撤退。越来越高的技术,需要工程的事物就越来越少。像人类一样完成大量工作也是AGI的最终目标。”张彭说。

另一位大型公司的人告诉科学技术创新委员会每日记者,Manus更喜欢使用AI技术来优化特定情况下的流程和经验,而不是专注于潜在的技术突破。 “但是,马努斯本身未能形成有效的产品障碍。随后出现大量开源版本的马努斯损坏了它的稀有性,而'沉思'的出现就是一个例子。”

目前,为了实现可用性,有必要突破公共和私人域之间的某些数据障碍,以及不同平台之间的障碍。

例如,Manus以前很流行,但是他随后在复杂任务中的表现反复发生。实际的测试案例是,当解析文件时,MANUS与非标准格式的兼容性较差,并且某些数据直接丢失。网页爬行经常被验证代码截获,并且任务被中断。

说到解决方案时,张彭告诉《科学技术创新委员会》的记者,该公司选择了一种一般场景,公众在公开展示“沉思”时很容易理解。但是,对于专业领域,企业用户或具有特定限制的用户,Zhipu已建立了一组功能解决方案。该解决方案将通过公司的未来MAAS平台(AS-A-Service)和智能开发平台促成。开发人员和企业用户可以根据这两个基本平台轻松调用资源,以实现快速适应和功能扩展。张彭特别强调,这些是产品级优化,而不是模型级问题。

“例如,诸如登录网络磁盘之类的其他操作本质上是智力不如人类的智能。如果他们可以通过图灵测试,并且其能力与人类的能力非常接近,那么很难实现当前的封锁和拦截策略。”

他进一步解释说,普通代理人无法存在缺点,包括文本,思维,操作,环境感知和理解能力,通话工具以及重复尝试等,并且无法有明显的缺点。一旦存在明显的缺点,申请成功率将急剧下降。

“我们一直坚持将语言多模式能力注入所有模型,这源于了解人类的认知本质。”张彭指出,作为具有全面认知能力的活生物体,人类具有整体特征。当公众检查AI系统时,它们通常不会将自己限制为单维能力比较,而是通过多模式互动体验形成整体认知。即使模型在逻辑推理和自然语言产生等单个指标中超过了人类,如果多模式互动功能存在缺点,它们仍然会被视为“智能缺陷”。这种现象表明,技术开发人员不应简单地责怪外部环境,而是需要重新检查模型架构级别的技术演化路径。

随着代理能力的持续发展,其硬件方面的切入点将来将变得更加丰富,包括机器人,眼镜和其他设备,将成为新的接入点。这带来了新的问题:呼唤这些入口面临什么挑战?

张彭说,AutoGLM早些时候在手机上使用,而这种“沉思”只是将其移至PC。可以访问其他智能硬件,例如眼镜,汽车安装和平板电脑。 “但是确实存在一些问题,例如不同类型的设备的最终交互方法是不同的。例如,眼镜不能具有键盘,因此他们需要使用语音进行交互,并且语音引入了全新的模式。”

“因此,目前,访问代理并不像简单地简单地'插入芯片并访问现成的SDK'那样容易。这种'插入式'播放'便利性仍然是未来的愿景,目前无法实现。”

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。