广场
最新
热门
资讯
我的主页
发布
User_any
2026-03-07 00:05:30
关注
#OpenAIReleasesGPT-5.4
🎉 OpenAI正式宣布了GPT-5.4,这是其最新模型,在AI界引发了热议。GPT-5.4被誉为“最强大且高效的前沿模型”,在继任者GPT-5.2的“思考”能力基础上,迈出了更大的一步,在推理、编码和自主工具工作流程方面取得了重大突破。这个新版本有潜力从根本上改变AI的角色,尤其是在专业工作流程中。
🤔 主要特性与改进
🔹 原生计算能力:GPT-5.4最引人注目的创新之一是它成为首个具备原生计算能力的通用模型。这意味着该模型可以解释屏幕图像,发出鼠标和键盘指令,通过Playwright自动化浏览器,并完成复杂的跨应用工作流程。在OSWorld-Verified基准测试中成功率达75%,超过人类的(72.4%),充分展示了其在此领域的能力。
🔹 100万Token上下文窗口:该模型在API和Codex中支持高达一百万Token的上下文窗口,使其能够在大型代码库、文档和合同上执行长时间任务和复杂推理链,且不会丢失追踪。这展示了模型在深入分析和大规模项目中的独特能力。 🔹 提高准确性与减少幻觉:OpenAI表示,GPT-5.4比之前的模型减少了33%的虚假声明,完整回答中的错误率降低了18%。这增强了其在需要敏感信息的专业应用中的可靠性。
🔹 工具搜索:API新增的这一功能允许模型根据需求动态搜索工具定义。这减少了47%的Token使用,带来成本和延迟优势,特别适合使用大型工具生态系统的开发者。
🔹 思考计划与中期干预:GPT-5.4在ChatGPT中的“思考”提供了针对复杂查询的预设推理策略。用户可以在模型响应中途干预,添加指令或改变方向,从而获得更精准、更符合上下文的输出。
🔹 两种不同版本:该模型在ChatGPT中作为GPT-5.4 Thinking(面向Plus、Team和Pro订阅用户)和GPT-5.4 Pro(面向Pro和企业计划)提供,旨在应对更复杂任务的最大性能。
🕵️ 竞争与影响:
✨ GPT-5.4的发布加剧了与谷歌Gemini、Anthropic的Claude Opus 4.6等竞争对手的角逐。OpenAI的基准测试显示,GPT-5.4在OSWorld-Verified和GDPval等关键指标上优于竞争对手。这次快速迭代再次证明了AI公司之间的领导竞争有多么激烈。
社区反应与未来展望:
✨社区的初步反应普遍积极。开发者和科技爱好者对新功能带来的潜力感到兴奋。许多人强调,该模型不再只是“助手”,而是具有直接在软件环境中执行任务能力的“操作员”。这预示着一种可能重新定义AI与人类合作方式的变革,甚至可能改变整个工作流程。
🤔然而,也存在一些争议。模型仅对高级订阅用户开放的事实引发了用户对成本和可访问性的担忧。此外,考虑到GPT-5.3刚刚在几天前发布,这样的快速版本更新让一些用户感到惊讶,并提出疑问:“这只是营销策略吗?”
✍️总之,GPT-5.4代表了AI技术的重大进步。凭借增强的推理能力、原生计算能力和更高的可靠性,它为专业用户和开发者提供了突破性的机遇。这个模型开启了一个未来:人工智能不仅能生成信息,还能主动与数字世界互动,自动执行复杂任务。然而,由于这一快速发展带来的伦理、安全和可访问性问题,仍将是行业在未来一段时间内必须面对的重要挑战。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
37人点赞了这条动态
赞赏
37
30
1
分享
评论
请输入评论内容
请输入评论内容
评论
Yunna
· 04-18 12:41
LFG 🔥
回复
0
Yusfirah
· 04-18 02:24
LFG 🔥
回复
0
Kai_Zen
· 03-31 21:51
1000倍的Vibes 🤑
查看原文
回复
0
Kai_Zen
· 03-31 21:51
钻石手 💎
查看原文
回复
0
Kai_Zen
· 03-31 21:51
登月 🌕
查看原文
回复
0
Kai_Zen
· 03-31 21:51
2026 GOGOGO 👊
回复
0
world_oneday
· 03-15 20:58
直达月球 🌕
查看原文
回复
0
Seyyidetünnisa
· 03-14 01:07
直达月球 🌕
查看原文
回复
0
Seyyidetünnisa
· 03-14 01:07
LFG 🔥
回复
0
Sheen crypto
· 03-08 13:08
直达月球 🌕
查看原文
回复
0
查看更多
热门话题
查看更多
#
WCTC交易王PK
55.78万 热度
#
美国寻求战略比特币储备
5877.39万 热度
#
比特币ETF期权持仓限额增4倍
103.49万 热度
#
美联储利率不变但内部分歧加剧
4.39万 热度
#
DeFi4月安全事件损失超6亿美元
1016.87万 热度
置顶
网站地图
#OpenAIReleasesGPT-5.4
🎉 OpenAI正式宣布了GPT-5.4,这是其最新模型,在AI界引发了热议。GPT-5.4被誉为“最强大且高效的前沿模型”,在继任者GPT-5.2的“思考”能力基础上,迈出了更大的一步,在推理、编码和自主工具工作流程方面取得了重大突破。这个新版本有潜力从根本上改变AI的角色,尤其是在专业工作流程中。
🤔 主要特性与改进
🔹 原生计算能力:GPT-5.4最引人注目的创新之一是它成为首个具备原生计算能力的通用模型。这意味着该模型可以解释屏幕图像,发出鼠标和键盘指令,通过Playwright自动化浏览器,并完成复杂的跨应用工作流程。在OSWorld-Verified基准测试中成功率达75%,超过人类的(72.4%),充分展示了其在此领域的能力。
🔹 100万Token上下文窗口:该模型在API和Codex中支持高达一百万Token的上下文窗口,使其能够在大型代码库、文档和合同上执行长时间任务和复杂推理链,且不会丢失追踪。这展示了模型在深入分析和大规模项目中的独特能力。 🔹 提高准确性与减少幻觉:OpenAI表示,GPT-5.4比之前的模型减少了33%的虚假声明,完整回答中的错误率降低了18%。这增强了其在需要敏感信息的专业应用中的可靠性。
🔹 工具搜索:API新增的这一功能允许模型根据需求动态搜索工具定义。这减少了47%的Token使用,带来成本和延迟优势,特别适合使用大型工具生态系统的开发者。
🔹 思考计划与中期干预:GPT-5.4在ChatGPT中的“思考”提供了针对复杂查询的预设推理策略。用户可以在模型响应中途干预,添加指令或改变方向,从而获得更精准、更符合上下文的输出。
🔹 两种不同版本:该模型在ChatGPT中作为GPT-5.4 Thinking(面向Plus、Team和Pro订阅用户)和GPT-5.4 Pro(面向Pro和企业计划)提供,旨在应对更复杂任务的最大性能。
🕵️ 竞争与影响:
✨ GPT-5.4的发布加剧了与谷歌Gemini、Anthropic的Claude Opus 4.6等竞争对手的角逐。OpenAI的基准测试显示,GPT-5.4在OSWorld-Verified和GDPval等关键指标上优于竞争对手。这次快速迭代再次证明了AI公司之间的领导竞争有多么激烈。
社区反应与未来展望:
✨社区的初步反应普遍积极。开发者和科技爱好者对新功能带来的潜力感到兴奋。许多人强调,该模型不再只是“助手”,而是具有直接在软件环境中执行任务能力的“操作员”。这预示着一种可能重新定义AI与人类合作方式的变革,甚至可能改变整个工作流程。
🤔然而,也存在一些争议。模型仅对高级订阅用户开放的事实引发了用户对成本和可访问性的担忧。此外,考虑到GPT-5.3刚刚在几天前发布,这样的快速版本更新让一些用户感到惊讶,并提出疑问:“这只是营销策略吗?”
✍️总之,GPT-5.4代表了AI技术的重大进步。凭借增强的推理能力、原生计算能力和更高的可靠性,它为专业用户和开发者提供了突破性的机遇。这个模型开启了一个未来:人工智能不仅能生成信息,还能主动与数字世界互动,自动执行复杂任务。然而,由于这一快速发展带来的伦理、安全和可访问性问题,仍将是行业在未来一段时间内必须面对的重要挑战。