OpenAI推出o3-mini推理模型：低成本高效能，科学数学编程能力全面提升

来源：网络作者：日期：2025-02-01 11:34:50

“ O3-Mini功能可以设置为低级，中和高。在数学，编程和科学方面设置媒体O3-Mini和O1的能力是等效的，但响应速度更快。评估专家测试人员的评估表明它显示了O3-Mini给出的答案比O1-Mini更准确和清晰。

从能力的角度来看，作为迷你版本，O3-Mini在某些测试中的性能略微超级O1。在数学测试AIME 2024中，博士水平测试GPQA钻石，竞争编码测试CodeForcess，软件工程测试SW -Bench，O3 -Mini分数为87.3、79.7、2130、49.3，是83.3、78、1891、48.9。

_推理分析试卷_推理题网站

此外，在编码测试LiveBench中，O3-MINI的表现要比O1表现更好，并且在常识测试通用知识中的表现要比O1-Mini表现更好。从速度的角度来看，在A/B测试中O3-MINI的平均响应时间（比较测试）为7.7秒，响应速度比O1-MINI快24％。

此前，大型国内模型公司DeepSeek发行了DeepSeek-R1，并表示该模型的模型性能是为Openai O1进行了基准测试。该模型不仅是开源，而且API（接口）的价格明显低于O1。 DeepSeek-R1输入（高速缓存），输出定价分别为百万tokens1 yuan和6元，少于55元和438元的O1。 Openai首席执行官Sam Altman在1月23日宣布，Openai将推出新一代O3 Mini版本，而ChatGpt Free用户将能够使用O3-Mini Essence

OpenAI正式推出了O3-Mini后，OpenAI再次强调Chatgpt为免费用户提供了免费的用户模型。用户可以在消息编辑器中选择“原因”来尝试使用OpenAI 3-Mini。但是，付费用户的使用范围更大，可以使用O3-Mini的高功能。 Chatgpt Plus和团队用户的交通限制从每天的每天50增加到每天03 -mini，Pro用户可以无限制地使用O3 -Mini。

OpenAI还提供越来越低的API通话价格。根据它的引入，自GPT-4推出以来，每个代币的定价下降了95％。 O3-Mini输入（高速缓存），每百万个代币的产出为0.55美元和4.4美元，仍然高于DeepSeek-R1。

推理分析试卷__推理题网站