APP下载
APP二维码
联系我们
APP二维码
返回

OpenAI推出o3-mini推理模型:低成本高效能,科学数学编程能力全面提升

来源:网络   作者:   日期:2025-02-01 11:34:50  

“ O3-Mini功能可以设置为低级,中和高。在数学,编程和科学方面设置媒体O3-Mini和O1的能力是等效的,但响应速度更快。评估专家测试人员的评估表明它显示了O3-Mini给出的答案比O1-Mini更准确和清晰。

从能力的角度来看,作为迷你版本,O3-Mini在某些测试中的性能略微超级O1。在数学测试AIME 2024中,博士水平测试GPQA钻石,竞争编码测试CodeForcess,软件工程测试SW -Bench,O3 -Mini分数为87.3、79.7、2130、49.3,是83.3、78、1891、48.9。

_推理分析试卷_推理题网站

_推理分析试卷_推理题网站

此外,在编码测试LiveBench中,O3-MINI的表现要比O1表现更好,并且在常识测试通用知识中的表现要比O1-Mini表现更好。从速度的角度来看,在A/B测试中O3-MINI的平均响应时间(比较测试)为7.7秒,响应速度比O1-MINI快24%。

此前,大型国内模型公司DeepSeek发行了DeepSeek-R1,并表示该模型的模型性能是为Openai O1进行了基准测试。该模型不仅是开源,而且API(接口)的价格明显低于O1。 DeepSeek-R1输入(高速缓存),输出定价分别为百万tokens1 yuan和6元,少于55元和438元的O1。 Openai首席执行官Sam Altman在1月23日宣布,Openai将推出新一代O3 Mini版本,而ChatGpt Free用户将能够使用O3-Mini Essence

OpenAI正式推出了O3-Mini后,OpenAI再次强调Chatgpt为免费用户提供了免费的用户模型。用户可以在消息编辑器中选择“原因”来尝试使用OpenAI 3-Mini。但是,付费用户的使用范围更大,可以使用O3-Mini的高功能。 Chatgpt Plus和团队用户的交通限制从每天的每天50增加到每天03 -mini,Pro用户可以无限制地使用O3 -Mini。

OpenAI还提供越来越低的API通话价格。根据它的引入,自GPT-4推出以来,每个代币的定价下降了95%。 O3-Mini输入(高速缓存),每百万个代币的产出为0.55美元和4.4美元,仍然高于DeepSeek-R1。

推理分析试卷__推理题网站

尽管DeepSeek并未透露DeepSeek-R1的培训成本,但DeepSeek的培训预算揭示了另一种模型DeepSeek-V3。在O1的同时,培训成本也可能很低,这可能意味着DeepSeek团队的技术水平很高。由于DeepSeek最近受到关注,Openai也影响了某些压力。

Openai正在采取措施维持自己的优势。除了推出O3-Mini“ Ying Ying”外,最近还有消息称Openai正在谈判新的一轮融资,并计划将资金筹集到400亿美元。一轮融资将由软银集团领导。 Openai的估值达到了3000亿美元,但谣言尚未得到Openai的确认。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。