APP下载
APP二维码
联系我们
APP二维码
返回

OpenAI发布GPT-4.1系列模型:支持100万tokens上下文,性能超越GPT-4.5

来源:网络   作者:   日期:2025-04-15 08:08:33  

同一天,OpenAI首席执行官Ultraman表示,API中现在可以使用GPT -4.1(和-Mini和-nano)。

由于GPT-4.1的发布,OpenAI宣布将消除最近发布的GPT-4.5,这可以看到。

当前,如果您想体验GPT-4.1,但无法通过API身份验证,Microsoft已在Azure OpenAI上启动了该模型,并且可以使用。

GPT-4.1最大的亮点之一是它对100万个代币背景的支持,这也是Openai首次发布较长的窗口模型。

与以前的型号相比,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO能够处理多达100万个令牌,是GPT-4O的8倍。

_奥特曼发出的声音是什么意思_奥特曼发言视频

Openai在长上下文Evals上测试了长文本。测试结果表明,GPT-4.1系列的三个模型可以在语料库中的任何深度(无论是开始,中间还是末端,甚至在最高100万个标记的上下文中)找到目标文本,该模型都可以准确地定位目标文本。

OpenAI还在多轮核心中进行了测试,该核心方案通过创建综合对话来测试模型在长篇小说中的理解和推理功能。在这些对话中,用户和助手交替进行对话,用户可以要求模型生成有关主题的诗,然后要求生成另一首关于另一个主题的诗,然后要求生成有关第三个主题的简短故事。该模型需要在这些复杂的对话中找到特定的内容,例如“关于主题的第二个短篇小说”。

测试结果表明,在处理高达128K令牌的数据时,GPT-4.1比GPT-4O明显好,并且在多达100万个令牌的背景下仍然可以保持高性能。在编码功能测试时,SWEBENCH评估将模型置于Python代码库环境中,从而允许其探索代码库,写代码和测试用例。结果表明,GPT-4.1的准确率达到55%,而GPT-4O仅为33%。

奥特曼发言视频_奥特曼发出的声音是什么意思_

在此测试中,该模型接收了一个代码库和问题描述,然后需要生成一个补丁以解决问题,并且该模型的性能将在很大程度上取决于所使用的提示和工具。

在多语言编码功能测试方面,Ader Polyglot基准涵盖了多种编程语言和不同格式的要求。与GPT-4O相比,GPT-4.1使差异性能翻了一番,在处理多语言编程任务,代码优化和版本管理时,其效率更高。

在指令合规性测试中,OpenAI构建了内部评估系统,模拟API开发人员的使用方案,并测试模型遵循复杂说明的能力。每个样本包含分类为不同类别的复杂说明,并分为难度级别。在评估困难子集中,GPT-4.1远远优于GPT-4O。

在视频MME基准测试中,GPT 4.1了解30至60分钟的无字幕视频并回答多项选择问题,达到了分数的72%,达到当前最佳水平,并在理解视频内容的理解方面取得了重大突破。

在价格方面,虽然GPT-4.1系列的性能在价格上更具竞争力。 GPT-4.1比GPT-4O低26%,而GPT-4.1 NANO(最小,最便宜,最便宜的车型)的价格仅为每百万代币12美分。

_奥特曼发出的声音是什么意思_奥特曼发言视频

4月14日,当地时间,OpenAI首席执行官Ultraman在社交媒体上透露,下周将发布许多新产品。他说,他说他将在几周内发布O3和O4-Mini,并在接下来的几个月内释放GPT-5。

根据OpenAI在其官方网站上发布的公告,两年前由OpenAI推出的人工智能Model GPT-4将于本月底从聊天机器人Chatgpt“退休”。 Openai表示,从4月30日起,GPT-4将被GPT-4O“完全取代”,GPT-4O是Chatgpt当前的默认模型。但是,GPT-4仍然可以通过OpenAI的API使用。

“在积极的评估中,GPT-4O在书写,编码,STEM等方面已超过GPT-4。此外,最近的升级进一步改善了GPT-4O的教学依从性,解决问题和对话性流量,使其成为GPT-4的天然后继者。”

GPT-4于2023年3月推出,用于Chatgpt和Microsoft的Copilot Chatbot。 GPT-4模型具有多个版本,并且具有多模式功能,这使他们能够同时了解图像和文本。 OpenAI首席执行官Altman还表示,GPT-4很大,培训成本超过1亿美元。

2023年11月下旬,OpenAI推出了GPT-4 Turbo型号,这是一种更快,更便宜的车型。

GPT-4O于去年5月推出,在多模式功能中更强大。据当时的Openai首席技术官称,GPT-4O中的“ O”代表“全方位”。

_奥特曼发出的声音是什么意思_奥特曼发言视频

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。