APP下载
APP二维码
联系我们
APP二维码
返回

深度求索创始人梁文锋出席国务院座谈会,探讨国产大模型发展前景

来源:网络   作者:   日期:2025-01-21 17:09:35  

国内大型模型公司DeepSeek创始人梁文峰出席了此次座谈会,这一信息立即被市场捕捉到。梁文峰是DeepSeek创始人,也是领先的量化私募股权公司Magic Square的创始人。他的创业领域横跨金融和人工智能领域。

市场尤其关注梁文峰在新年首次总理座谈会上的讲话。据记者了解,讨论内容涵盖了国产大型车型的发展和前景。

image

从履历来看,梁文峰17岁考入浙江大学,30岁创办欢芳。2021年欢芳一度突破千亿,当时他年仅36岁。随后,DeepSeek于2023年7月成立,公开资料显示,其也是国内为数不多的拥有万卡集群算力的大型AI模型公司之一。

DeepSeek在国内外的声誉似乎正在超越Magic Square Quantification。成立仅一年半,国产大型号DeepSeek-V3就在2024年底风靡全球。业内人士表示,这也是梁文峰出席首届总理座谈会的重要原因。新的一年。

DeepSeek之所以受到技术圈关注,是因为DeepSeek-V3的出现大大降低了大型模型训练和应用的成本。 DeepSeek-V3的训练成本仅为557.6万美元,而OpenAI训练ChatGPT-4o的成本高达7800万美元。即便是一亿美元,双方的成本也相差至少10倍。

分享会座谈会的同义_参加座谈会的心得体会_

性能方面,DeepSeek-V3在数学、编码能力和中文知识问答方面也超越了ChatGPT-4o。这种性价比令业界震惊,DeepSeek-V3 向全球技术开发团队开源。这就是“AI界的拼多多”称号的由来。

从团队配置来看,DeepSeek团队只有139名研发人员,而ChatGPT的OpenAI团队有1200名研究人员。团队规模是DeepSeek的近9倍。最近的热门话题是“雷军年薪千万,挖角1995年出生的天才AI少女”。这位AI妹子是DeepSeek团队的开发者。

1月20日,DeepSeek正式发布了DeepSeek-R1模型。

该模型在数学、编码、自然语言推理等任务上的性能与 OpenAI o1 官方版本相当。 DeepSeek表示,R1在后训练阶段大规模使用强化学习技术,仅用很少的标记数据就大大提高了模型的推理能力。 DeepSeek不仅公开了所有R1训练技术,还提炼出6个小模型并向社区开放,允许用户训练其他模型。

根据此前的信息,DeepSeek暂时没有商业化的考虑。

国内大型典范企业亮相总理论坛,被业界解读为国家对科技的重视。值得注意的是,在本次座谈会上,李强强调,要用科技创新推动新旧动能转换,着力突破关键核心技术和前沿技术,加快科技成果产业化,努力培育更多新的经济增长点。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。