新最新

股市

百科

热点
24快讯

APP下载

APP二维码

联系我们

APP二维码

OpenAI推出轻量级推理大模型o3-mini，支持AI推理努力程度调整，2024年AIME测试表现优异

来源：网络作者：日期：2025-02-01 08:07:01

Openai介绍了O3-Mini支持开发人员调整“ AI推理效应”的选项，分为三个级别：低，中和高。这种灵活性使O3米尼在面对问题时可以“更加努力地思考”，并且在效率需要效率时优先考虑响应速度。

在周五的新闻稿中，Openai披露，在2024年美国数学邀请赛（Aime 2024）的测试中，低推理努力的o3-mini 准确率（60％）与o1-mini差不多，但速率更快；而，但速率更快；而，但速率更快；而通过中等努力，O3米尼的准确性可以提高到79.6％，这相当于O1模型。在最大努力的水平下，O3米尼的准确性可以进一步提高到87.3％。

就博士学位科学问题（GPQA钻石）而言，三种努力模型的准确率分别为70.6％，76.8％和79.7％。

在AIME 2024测试中，DeepSeek-R1模型的水平对比度为79.8％，GPQA钻石测试的准确性为71.5％。

当然，DeepSeek的最大荣誉是使Openai突然变得慷慨。

OpenAI宣布，从周五开始，免费ChatGpt用户还可以通过在编辑器中选择“推理”来尝试O3-MINI模型，这也是公司首次向自由用户开放的推理模型。

对于付费用户，O3-Mini将替换模型选择器中的O1-Mini。作为升级的一部分，Chatgpt Plus和团队用户每月的费用约为20美元，也从每天的O1-Mini 50增加到150 o3米尼。每月支付200美元的Chatgpt Pro用户可以无限制地访问O3-Mini。

分类： 股市

地址： http://news.lianzhou.cn/post/7550.html

标签：OpenAI o3-mini AI推理 2024AIME测试轻量级模型

责任编辑： admin

版权声明：除非特别标注，否则均为本站原创文章，转载时请以链接形式注明文章出处。

相关文章：

GPT-4.1震撼发布：支持100万tokens上下文，OpenAI首次推出长窗口模型

OpenAI秘密开发社交网络项目，或将整合ChatGPT功能加剧与马斯克竞争

OpenAI ChatGPT图像生成新功能：被用来伪造收据？

OpenAI获软银领投400亿美元融资估值达3000亿美元创历史新高

OpenAI完成400亿美元融资 3000亿估值仅次于SpaceX

OpenAI预计2025年收入将达127亿美元，同比增长两倍

ChatGPT图像生成功能迎来历史性升级：GPT-4o模型助力更精准文生图

微软、贝莱德与马斯克xAI联手，共建300亿美元AI基础设施联盟

OpenAI发布全新开发工具和API，轻松打造智能体的秘诀

OpenAI与CoreWeave达成119亿美元五年合作协议，云服务领域重大布局

美股三大指数集体低开，道指跌0.42%，纳指跌0.22%，标普500指数跌0.31% - 最新市场动态

英伟达H20 AI芯片需求激增，DeepSeek模型推动国内公司大幅增加订单

ChatGPT上网查询与数据分析功能：提升研究报告生成效率与准确性的专业助手

微软回应市场传闻，强调800亿美元投资与创纪录增长，TD Cowen追加研报解析

OpenAI用户增长显著，ChatGPT周活跃用户达4亿，今年营收有望突破110亿美元

马斯克xAI公司发布Grok 3模型，性能超越ChatGPT及DeepSeek，免费开放使用

马斯克发布Grok 3大模型，迎战OpenAI GPT 4o，AI领域巅峰对决即将上演

马斯克宣布Grok 3大模型发布时间：太平洋时间周一晚上8点现场演示

发表评论取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。