OpenAI 发布 GPT-4.1:在上下文、指令和效率方面具有关键改进的新模型系列

最后更新: 15/04/2025
作者: 艾萨克
  • GPT-4.1 及其迷你版和纳米版在编码、指令跟踪和扩展上下文使用方面提供了显著的改进。
  • 该模型允许最多一百万个令牌的上下文窗口,并且仅可通过开发人员 API 获得。
  • GPT-4.1 在多项技术测试中均优于其前代产品和竞争对手,尽管它尚未 ChatGPT.
  • 它以经济效率而著称,每个代币的成本比以前的版本更低。

OpenAI 的 ChatGPT 4.1 模型

OpenAI 宣布新款 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 型号正式上市,其流行系列的演变 人工智能 面向自然语言处理。新版本并非通过 ChatGPT 供家庭使用,而是通过 OpenAI API 独家提供,专注于将人工智能解决方案集成到其平台的专业人士和公司。对于仍在使用旧版本的用户, 建议考虑新的整合.

这些新模型的开发是为了提供更高的效率,更深入地理解上下文并提高遵循复杂指令的能力。此外,其知识库已更新至2024年XNUMX月,使其能够处理比以前版本更多的最新信息。

更加多功能的全新型号系列

新的 GPT-4.1 迷你和纳米模型

OpenAI 提出了三种不同的模型,每种模型都针对不同的需求和功能:

  • GPT-4.1:这是性能最佳的主力型号,专为更密集和复杂的任务而设计。
  • GPT-4.1迷你:优化性能,提高资源效率,降低延迟。
  • GPT-4.1纳米:最轻量级的版本,专为自动完成或文本分类等简单、大规模任务而设计。

这些模型中的每一个都可以使用最多 一百万个上下文标记,这比 GPT-128.000o 等前代模型的 4 个 token 限制有了显著的改进。此功能使他们能够分析非常大的文档或 数据库 复杂的文本,无需将其分割。对于那些对更多解决方案感兴趣的人 IA,您可以咨询 谷歌铁木,提出了一种不同的语言处理方法。

  人工智能驱动的5G网络切片:实际应用、技术和商业模式

突出的技术改进

GPT-4.1技术能力

其中最显著的技术改进是 GPT-4.1 模型在标准化行业评估中的表现。在基准测试中 SWE-bench 已验证,专注于 编程,该模型的得分为 54,6%,与 GPT-4o(33,2%)、GPT-4.5(38%)等前期模型的结果相比,有显著的提升。

按照指示,GPT-4.1 记录了 38,3% 在MultiChallenge测试中,相比GPT-10o提高了4个百分点以上。这种测试评估模型像人类一样理解和执行复杂指令的能力。与其他模型进行比较至关重要,在其他发展中也可以看到类似的方法,例如 高通骁龙G系列.

另一个相关测试是 视频-MME,专注于理解长上下文和多模式来源。在本次评估中,GPT-4.1 的得分为 72% 属于“长期没有”类别 字幕”,远远超越了之前的记录,并展现出更强的广泛语境推理能力。

此外,它还因生产量较少而脱颖而出 不相关的答案 并更好地理解结构化格式,这对于代码调试或自动客户服务等任务很有用。

调用 4 个型号 Scout、Maverick 和 Behemoth-2
相关文章:
Meta 凭借其 Llama 4 模型(Scout、Maverick 和 Behemoth)彻底改变了人工智能

开发人员的可用性和成本

OpenAI 仅通过其 API 提供这些模型,旨在将它们专业地集成到工具、SaaS 产品或定制虚拟助手中。 价格因型号而异 以及处理的令牌数量,并根据用户需求寻求平衡成本和容量的策略。

  • GPT-4.1:成本 每百万入场券 2 美元 y 每生成一百万个代币 8 美元.
  • GPT-4.1迷你:降低成本 每百万次入境 0,40 美元 y 每次出游 1,60 美元.
  • GPT-4.1纳米:最经济,成本 0,10 美元入场费 y 退出时 0,40 美元.
  将 Ollama 集成到企业网络和安全部署中的完整指南

由于这些调整后的利率以及 缓存提示,开发人员可以实现比以前版本更具性价比的解决方案。该策略还旨在避免使用大量文本或重复查询的项目出现成本超支。对于那些希望了解更多有关新版本的人来说,查看 微软新款 Surface,提供人工智能功能。

ChatGPT 在这一领域中处于什么位置?

尽管 GPT-4.1 模型在 ChatGPT 中不能直接使用,但 OpenAI 解释说,它的一些功能已经逐渐融入到该模型中。 GPT-4o,这仍然是 Web 和移动界面用户的默认设置。对于那些有兴趣提高使用该工具的人来说,保持最新状态至关重要,尤其是 安卓更新.

该公司表示,该模型 GPT-4.5 将于 14 年 2025 月 XNUMX 日起退役。这强化了巩固 GPT-4.1 等更高效、更经济的版本的想法。与此同时,GPT-4o 也将很快被取代,因为它的退役日期定于 30 月 XNUMX 日。

这表明 OpenAI 坚定地致力于彻底改革其产品组合,放弃旧模型,转而采用结合了改进的技术性能和大幅降低运营成本的更现代的版本。对开发新技术的关注让我们想起了像 百度,并提出了自己的模型, 厄尼4.5.

与竞争对手相比的性能

尽管 GPT-4.1 已经表现出了长足的进步,但在某些测试中仍然略微落后于一些竞争对手。例如,模型 双子座 2.5 临德 Google 达到一个 63,8% 在 SWE-bench Verified 和 Anthropic 的 Claude 3.7 中 Sonnet 的得分相同,为 62,3%。即便如此,GPT-4.1 仍将自己定位为一种成本更低的高性能替代品。

  Gemini 与 Android 上其他应用集成的教程

这种技术性能、处理速度和更实惠价格的平衡尤其吸引寻求可扩展解决方案的中小型开发商。此外,与其他推出测试版或仅限邀请版的公司相比,其功能从推出之日起即可使用,这是一个优势。同样的,竞争模型的进展,例如 Android 16月XNUMX日 值得一提的是。

最近几个月,一些专业出版物发现了以下名称: o3、o4-mini 和 o4-mini-high 在 ChatGPT 网络应用程序代码中,这似乎表明 OpenAI 仍在致力于扩展其模型生态系统。这可能包括针对特定任务的新变体,特别是与推理或更复杂的数学运算相关的任务。

面对日益混乱的命名法,OpenAI 表示可以采用更简单的结构来重新组织其模型。不过,目前这一改变仍处于搁置状态。

GPT-4.1及其变体的推出代表了OpenAI的战略举措,旨在加强其在人工智能开发领域的影响力,同时保持经济效率。虽然这些版本尚未通过 ChatGPT 向公众开放, 其功能可能会在未来的服务更新中得到扩展。.

mwc 新闻 2025-0
相关文章:
巴塞罗那 MWC 2025 最重要的创新