当前位置：首页 > AI应用 > 正文内容

ai challenge AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens

admin3天前AI应用11

ai challenge AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens

IT之家 4 月 15 日消息，公司今天（4 月 15 日）发布博文，宣布以 API 的形式发布 GPT-4.1 系列模型，涵盖 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

这些模型在编程、指令遵循和长文本理解方面全面超越前代 GPT-4o 及 GPT-4o mini，上下文窗口最高支持 100 万，知识更新至 2024 年 6 月。

需要注意的是，该系列模型现阶段专为开发者打造，目前仅通过开发者 API 方式提供，普通用户暂时无法通过页面体验该模型。

表示在编程方面，相比较 GPT-4o 模型ai challenge，GPT-4.1 模型的代码生成速度飙升 40%，且用户输入查询的成本降低了 80%。

新模型性能

在官方博文中表示，GPT-4.1 系列模型在编程、指令遵循和长文本处理上表现优异，全面超越 GPT-4o 及 GPT-4o mini。

GPT-4.1 在编程测试 SWE-bench 中得分 54.6%ai challenge AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens，较 GPT-4o 提升 21.4 个百分点，在指令遵循测试中提升 10.5 个百分点，在多模态长文本测试 Video-MME 中创下 72.0% 的新纪录。

GPT-4.1 mini 和 nano 展现了小型模型的巨大潜力。GPT-4.1 mini 在多项基准测试中媲美甚至超越 GPT-4o，延迟降低近一半，成本减少 83%。

GPT-4.1 nano 作为最快、最经济的选择，拥有 100 万个 token 的上下文窗口，在 MMLU 测试中得分 80.1%，适合分类和自动补全任务。

这些模型通过优化推理栈和提示缓存技术，显著降低了首次响应时间，为开发者提供高效低成本的解决方案。

GPT-4.1 系列模型在实际应用中表现突出，特别适合构建智能代理，处理复杂任务。例如，测试显示，GPT-4.1 在编程效率上提升 30%ai challenge，减少 50% 不必要编辑；的法律 AI 助手使用 GPT-4.1 后，多文档审查准确率提升 17%。

命名混乱引发关注

GPT-4.1 的发布加剧了产品命名的复杂性。

目前已包含 GPT-4o、GPT-4o mini、o1-pro 等多种模型选项。首席执行官山姆・奥尔特曼（Sam ）早在 2024 年 2 月就承认命名问题。

他在 X 平台表示，产品线过于繁杂，计划通过未来的 GPT-5 整合品牌，计划在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 模型ai challenge AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens，从而缓解命名混乱。

这一临时模型于 2024 年 2 月推出，曾被批评为“失败品”，开发者需在 2025 年 7 月前迁移到其他模型，不过，GPT-4.5 在中暂时保留，未受影响。

费用

API价格方面，-4.1模型每 100万输入费用为 2 美元（IT之家注：现汇率约合 14.6 元人民币），每 100万输出费用为 8 美元（现汇率约合 58.3 元人民币）。在中等查询中，相比较GPT-4o，GPT-4.1不仅能提供更强悍的性能ai challenge，而且便宜 26%。

此外，-4.1nano是最便宜、最快的模型：

加入微信交流群：************ ，请猛戳这里→点击入群

随机文章
热门文章
热评文章

扫描二维码推送至手机访问。

版权声明：本文由智潮脉搏发布，如需转载请注明出处。

本文链接：https://zcmobo.com/post/3200.html

标签: AI OpenAI GPT-4.1 编程模型

分享给朋友：

返回列表

上一篇：ai智能是什么意思

下一篇：OpenAI GPT-4.1系列来袭：编程效率提升40%，百万tokens上下文新境界

“ai challenge AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens” 的相关文章

近年综艺节目有哪些创新

近年综艺节目有哪些创新

在如今竞争激烈的综艺市场中，一档综艺节目要想脱颖而出并获得极高的收视率，必须具备独特的创新玩法。[综艺节目名称]正是凭借着其一系列令人眼前一亮的创新举措，迅速在众多综艺节目中崭露头角，收视率一路飙升，成为了观众们津津乐道的话题。该综艺节目打破了传统综艺的模式，大胆引入了互动元素。在每一期节目中，观众...

地摊经济的烟火气

地摊经济的烟火气

“夜市千灯照碧云，高楼红袖客纷纷。”这句古诗仿佛在描绘着如今的景象，地摊经济的复苏，让城市的烟火气又回来了。曾经，地摊经济在一些城市被视为影响市容市貌的“顽疾”，遭到了严厉的打击和取缔。随着经济形势的变化和人们生活需求的多样化，地摊经济以其独特的魅力重新走进了人们的视野。地摊经济的复苏，为城市带来了...

春赏花、夏榨油、秋收粮 “赏花 +” 扮 “靓” 经济新增长点

春赏花、夏榨油、秋收粮 “赏花 +” 扮 “靓” 经济新增长点

春天，大地复苏，万物焕发生机，那一片片绚烂的花海如同一幅幅绚丽的画卷，吸引着人们的目光，也为经济发展注入了新的活力。赏花，不再仅仅是一种休闲娱乐方式，更是成为了扮靓经济新增长点的重要元素。春赏花，那五彩斑斓的花朵，如梦幻般绽放在大地上。桃花粉若云霞，杏花洁白如雪，油菜花金黄一片，每一种花都有着独特的...

网红城市是什么意思

网红城市是什么意思

在当今快节奏的社会中，一座城市的爆火往往能引起广泛的关注和热议。而某座网红城市的一夜爆红，更是让人们充满了好奇和探究的欲望。究竟是什么原因让这座城市在瞬间成为了众人瞩目的焦点呢？这座网红城市拥有着得天独厚的自然景观。它坐拥着壮丽的山脉，那连绵起伏的山峰仿佛是大地的脊梁，在阳光的照耀下闪耀着金色的光芒...

中医脉诊数字化：AI 传感器读懂你的 “脉象密码”

在传统的中医领域中，脉诊一直是一项神秘而又精准的诊断技艺。医者通过触患者的脉搏，感受其细微的变化，从而推断出人体的健康状况、疾病类型以及病情的轻重缓急。这种传统的脉诊方式往往依赖于医者的经验和主观判断，难以实现量化和标准化，限制了其在现代医学中的应用和发展。随着科技的不断进步，中医脉诊也迎来了数字化...

疫情防控黑科技：AI 预测模型精准锁定下一个风险区

在抗击疫情的漫长征程中，科技始终是我们最坚实的后盾。而如今，AI 预测模型这一疫情防控黑科技的出现，犹如一把精准的利剑，能够在茫茫疫情数据中精准锁定下一个风险区，为疫情防控工作带来了前所未有的变革和突破。AI 预测模型的工作原理基于海量的疫情数据和先进的机器学习算法。它就像一个超级大脑，不断地对过去...