APP下载
APP二维码
联系我们
APP二维码
返回

中关村论坛:智源院长谈AI大模型热点,含幻觉解决等

来源:网络   作者:   日期:2025-03-30 09:09:56  

K图 BK1184_0

在人工智能浪潮席卷世界的时候,AI大型模型和体现的情报是行业和投资界的不道德重点。

在中冈论坛上,Zhiyuan研究所的主任王中尤(Wang Zhongyuan)分享了热门话题,例如解决大型模型幻觉问题的解决方案路径,获取具有体现的智能培训数据,以便在其中进行计算能力以及人类机器人的投资泡沫。

“幻觉”阻碍了大型模型从实验室进入行业到行业的登陆

Wang Zhongyuan指出,尽管大型模型技术取得了重大进展,但幻觉的问题已成为其从实验室转向工业降落的绊脚石。为了解决这个问题,有必要提高基本模型和推理能力,并使用一般向量,检索增强和其他方式。

他提到,Zhiyuan研究所在过去两年中推出的BGE模型有效地针对大型模型幻觉的问题,并采用开源形式,即在高级拥抱面上的下载次数。

多模式大型模型和世界模型是AGI的唯一途径

在大型模型的方向上,多模式的大规模模型和世界模型被认为是未来的重要趋势。 Wang Zhongyuan强调,现实世界中的多模式数据非常丰富,并且仅依靠大型语言模型来处理文本信息远非足够。

“目前,大型语言模型在理解和推理能力方面达到了很高的水平,甚至可以在某些领域接近硕士或博士学位,但它仍然无法理解这个世界的真正运营规则。”王中牛为例。

他说,多模式的大型模型和世界模型是实现真正的AGI的唯一途径,这可以使人工智能更好地感知和理解世界。

_智源研究院王仲远:机器人“泡沫”与“人形必要性”_智源研究院王仲远:机器人“泡沫”与“人形必要性”

体现的情报:从数字世界到物理世界的桥梁

体现的情报是大型模型从数字世界中进入物理世界的关键方向,并且仍然存在许多挑战。

Wang Zhongyuan说,基本模型遇到了一些瓶颈,例如当前的文本数据逐渐耗尽,并且大型语言基本模型的性能改善也减慢了。因此,多模式大型模型和物理世界硬件的结合已成为不可避免的。

他提到,体现智力的概念出现在较早的情况下,传统研究人员对从AI大型模型转变为体现智能领域的体现智能的理解以及在技术路线上尚未达成完全共识。

传统的机器人培训仍在使用大量的增强学习。通过反复的练习,机器人被教导抓住杯子,倒水,写刷子等。这种类型的人形机器人的概括将较弱。

“但是,大型模型技术,尤其是多模式的大型模型技术,将为整个体现的智能带来一些新的变量。”王中尤恩说,这些技术可以帮助机器人更快,更有效地具有“大脑”,从而具有更强的智力。

On the afternoon of March 29, Zhiyuan Research Institute released the cross-ontological embodied brain collaboration framework RoboOS and open source embodied brain RoboBrain, which can realize cross-scene multitasking lightweight and rapid deployment and cross-ontological collaboration, promote stand-alone intelligence to group intelligence, and provide underlying technical support for the development of embodied intelligence.

机器人的“气泡”和“人形必需”

该行业有一种观点认为,目前70%的场景不需要机器人具有“人类形状”,因此“机器人制造人形”的必要性也不足够。此外,许多公司都在人形机器人轨道上拥挤。该行业的未来趋势将是什么?

王中牛在一定程度上同意这种观点。他举了一个例子,说明该行业的许多机器人公司已经开始迭代轮子配置的机器人,以克服双方机器人稳定性不佳的问题。

“但是,从长远来看,人形机器人具有独特的优势,因为它们类似于人类的配置,它们可以更好地适应社会基础设施,从互联网数据中学习人类技能,并促进具体的智能和体现大脑模型的迭代。”王宗尤恩说。

但是,在短期内,人类机器人在实施行业方面仍然面临许多挑战。许多机器人仍处于“罐头”阶段,需要花费一些时间才能朝着“快速行动,稳定前进”的目标迈进。

数据和计算能力:AI行业开发的“双引擎”

数据采集​​和计算能力支持是AI行业发展的核心要素。 Wang Zhongyuan提到,随着文本数据逐渐消耗,可以通过培训后,数据合成和使用多模式数据来解决数据问题。尽管获得高质量的多模式数据和合成数据是昂贵的,但是可以使用工程技术和计算功率改进来降低成本。

说到有关计算能力的最新争议,Wang Zhongyuan认为,尽管DeepSeek技术有助于在有限的计算能力下训练与GPT4相当的大型模型,但计算能力仍然不够,而且大型模型技术远未结束。

工程优化为训练大规模参数模型创造了条件。如果缩放定律有效,则预计模型性能将进一步提高。

行业实施和投资:短期挑战和长期机会共存

一些投资者对智能行业的投资感到悲观,并认为有一个泡沫。从研究机构的角度来看,王中牛对体现情报的长期发展充满信心。他预测,人工智能应用有望在今年引起大爆炸,尤其是大型语言模型的实施。中国的大规模应用方案将加速这一过程。

但是,多模式大型模型仍处于相对较早的阶段,从广义上讲,实现AGI可能需要5 - 10年甚至更长的时间,这取决于许多因素,例如本体学能力,世界模型构建和数据。

就技术路线而言,体现的情报具有许多视图,例如无人驾驶领域的端到端大型模型和子模块解决方案。 Wang Zhongyuan指出,体现智能的发展相对复杂,许多体现智能模型的概括是有限的,因此可能需要很长时间才能实现完全端到端的端到端体现智能。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。