OpenAI推出轻量级推理大模型o3-mini,支持AI推理努力程度调整,2024年AIME测试表现优异
Openai介绍了O3-Mini支持开发人员调整“ AI推理效应”的选项,分为三个级别:低,中和高。这种灵活性使O3米尼在面对问题时可以“更加努力地思考”,并且在效率需要效率时优先考虑响应速度。
在周五的新闻稿中,Openai披露,在2024年美国数学邀请赛(Aime 2024)的测试中,低推理努力的o3-mini 准确率(60%)与o1-mini差不多,但速率更快;而,但速率更快;而,但速率更快;而通过中等努力,O3米尼的准确性可以提高到79.6%,这相当于O1模型。在最大努力的水平下,O3米尼的准确性可以进一步提高到87.3%。
就博士学位科学问题(GPQA钻石)而言,三种努力模型的准确率分别为70.6%,76.8%和79.7%。
在AIME 2024测试中,DeepSeek-R1模型的水平对比度为79.8%,GPQA钻石测试的准确性为71.5%。
当然,DeepSeek的最大荣誉是使Openai突然变得慷慨。
OpenAI宣布,从周五开始,免费ChatGpt用户还可以通过在编辑器中选择“推理”来尝试O3-MINI模型,这也是公司首次向自由用户开放的推理模型。
对于付费用户,O3-Mini将替换模型选择器中的O1-Mini。作为升级的一部分,Chatgpt Plus和团队用户每月的费用约为20美元,也从每天的O1-Mini 50增加到150 o3米尼。每月支付200美元的Chatgpt Pro用户可以无限制地访问O3-Mini。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。