首页 500强 活动 榜单 商业 科技 商潮 专题 品牌中心
杂志订阅

OpenAI发布其最强模型GPT-5.4,直指Anthropic核心市场

Beatrice Nolan
2026-03-09

该模型融合了高级推理能力、编程能力以及自主操作计算机和软件的功能,使企业级人工智能市场的竞争陷入白热化。

文本设置
小号
默认
大号
Plus(0条)

OpenAI首席执行官萨姆·奥尔特曼。图片来源:Kyle Grillot/Bloomberg via Getty Images

OpenAI发布了新一代人工智能模型GPT-5.4。公司称,这是其迄今为止面向专业场景能力最强的人工智能系统。该模型融合了高级推理能力、编程能力以及自主操作计算机和软件的功能,使企业级人工智能市场的竞争陷入白热化,而这一领域此前一直是Anthropic的优势阵地。

新模型整合了OpenAI此前分散在不同模型中的多项能力,集成了公司领先编程模型GPT-5.3-Codex的编程能力、更强的推理能力,以及模型能够自主在桌面、浏览器和软件应用之间操作的智能体能力。

该模型于3月5日向ChatGPT Plus、Team和Pro订阅用户推出,同时通过公司的API开放。针对需要处理复杂任务、追求更高性能的用户,OpenAI还提供了更强版本GPT-5.4 Pro。

在发布模型的同时,OpenAI还宣布推出Excel和Google Sheets版ChatGPT(测试版)。该版本将ChatGPT直接嵌入电子表格中,可以用于构建、分析并更新复杂的财务模型。公司还发布了一系列新的ChatGPT应用集成,包括FactSet、MSCI、Third Bridge和穆迪(Moody’s),旨在让团队能够将市场数据、公司数据以及内部数据整合到同一工作流程中。

此举也让OpenAI与竞争对手Anthropic展开了更直接的较量。Anthropic在2025年7月推出了面向金融行业的“Claude金融服务版”(Claude for Financial Services)产品,并在当年晚些时候进一步扩展相关功能。两家公司正在竞相争夺企业市场,面向已经准备好采用人工智能的行业推出可以完成实际工作的工具。

新模型的发布还可能引发投资者对人工智能冲击传统金融数据提供商的新一轮担忧。由于市场普遍担心人工智能将颠覆企业软件行业,这类公司的股价此前已经受到影响。今年早些时候,Anthropic发布Cowork插件后,市场一度出现大规模抛售SaaS股票的情况,因为投资者担心人工智能工具可能让传统软件供应商被淘汰。

新智能体能力

对于企业用户而言,GPT-5.4最重要的升级之一是其“开箱即用”的智能体能力。该模型可以自主操作计算机和软件,根据需要搜索并调用外部工具,还能够处理复杂的多步骤任务,而开发者无需自行搭建相应的底层架构。

OpenAI表示,GPT-5.4是公司迄今最注重事实、最可靠性的模型。公司在一篇博客文章中称,与GPT-5.2相比,该模型产生“幻觉”的概率明显下降:单个陈述出现错误的可能性降低33%,完整回复包含错误的概率降低18%。

GitHub的首席产品官马里奥·罗德里格斯在评价该模型时说:“开发者不仅需要一个可以写代码的模型,更需要一个能够像他们一样思考问题的模型。我们看到GPT-5.4在逻辑推理以及执行复杂、多步骤、依赖工具的工作流程方面表现非常出色。”

这些新功能使OpenAI在竞争日益激烈的智能体产品领域中,成为更直接的参与者。当前市场上的类似产品包括Perplexity Computer、微软(Microsoft)的Copilot Tasks以及OpenClaw。近期OpenClaw的走红也表明,用户越来越青睐可以在尽量减少人工干预的情况下处理长工作流程的人工智能系统。

OpenAI还指出,与此前的模型相比,GPT-5.4在词元使用效率方面有明显提升,也就是说它能够用更少的词元解决问题。虽然该模型每个词元的定价略高于GPT-5.2,但由于完成许多任务所需的词元数量更少,对于部分用户而言,这种效率提升可能抵消价格上涨带来的成本。(财富中文网)

译者:刘进龙

OpenAI发布了新一代人工智能模型GPT-5.4。公司称,这是其迄今为止面向专业场景能力最强的人工智能系统。该模型融合了高级推理能力、编程能力以及自主操作计算机和软件的功能,使企业级人工智能市场的竞争陷入白热化,而这一领域此前一直是Anthropic的优势阵地。

新模型整合了OpenAI此前分散在不同模型中的多项能力,集成了公司领先编程模型GPT-5.3-Codex的编程能力、更强的推理能力,以及模型能够自主在桌面、浏览器和软件应用之间操作的智能体能力。

该模型于3月5日向ChatGPT Plus、Team和Pro订阅用户推出,同时通过公司的API开放。针对需要处理复杂任务、追求更高性能的用户,OpenAI还提供了更强版本GPT-5.4 Pro。

在发布模型的同时,OpenAI还宣布推出Excel和Google Sheets版ChatGPT(测试版)。该版本将ChatGPT直接嵌入电子表格中,可以用于构建、分析并更新复杂的财务模型。公司还发布了一系列新的ChatGPT应用集成,包括FactSet、MSCI、Third Bridge和穆迪(Moody’s),旨在让团队能够将市场数据、公司数据以及内部数据整合到同一工作流程中。

此举也让OpenAI与竞争对手Anthropic展开了更直接的较量。Anthropic在2025年7月推出了面向金融行业的“Claude金融服务版”(Claude for Financial Services)产品,并在当年晚些时候进一步扩展相关功能。两家公司正在竞相争夺企业市场,面向已经准备好采用人工智能的行业推出可以完成实际工作的工具。

新模型的发布还可能引发投资者对人工智能冲击传统金融数据提供商的新一轮担忧。由于市场普遍担心人工智能将颠覆企业软件行业,这类公司的股价此前已经受到影响。今年早些时候,Anthropic发布Cowork插件后,市场一度出现大规模抛售SaaS股票的情况,因为投资者担心人工智能工具可能让传统软件供应商被淘汰。

新智能体能力

对于企业用户而言,GPT-5.4最重要的升级之一是其“开箱即用”的智能体能力。该模型可以自主操作计算机和软件,根据需要搜索并调用外部工具,还能够处理复杂的多步骤任务,而开发者无需自行搭建相应的底层架构。

OpenAI表示,GPT-5.4是公司迄今最注重事实、最可靠性的模型。公司在一篇博客文章中称,与GPT-5.2相比,该模型产生“幻觉”的概率明显下降:单个陈述出现错误的可能性降低33%,完整回复包含错误的概率降低18%。

GitHub的首席产品官马里奥·罗德里格斯在评价该模型时说:“开发者不仅需要一个可以写代码的模型,更需要一个能够像他们一样思考问题的模型。我们看到GPT-5.4在逻辑推理以及执行复杂、多步骤、依赖工具的工作流程方面表现非常出色。”

这些新功能使OpenAI在竞争日益激烈的智能体产品领域中,成为更直接的参与者。当前市场上的类似产品包括Perplexity Computer、微软(Microsoft)的Copilot Tasks以及OpenClaw。近期OpenClaw的走红也表明,用户越来越青睐可以在尽量减少人工干预的情况下处理长工作流程的人工智能系统。

OpenAI还指出,与此前的模型相比,GPT-5.4在词元使用效率方面有明显提升,也就是说它能够用更少的词元解决问题。虽然该模型每个词元的定价略高于GPT-5.2,但由于完成许多任务所需的词元数量更少,对于部分用户而言,这种效率提升可能抵消价格上涨带来的成本。(财富中文网)

译者:刘进龙

OpenAI has released GPT-5.4, a new AI model the company says is its most capable system to date for professional use. The model combines advanced reasoning, coding, and the ability to autonomously operate computers and software, turning up the heat in the competition for enterprise customers that has been Anthropic’s stronghold.

The new model consolidates some of the capabilities that OpenAI had previously spread across separate models, bringing together the coding strengths of GPT-5.3-Codex—the company’s leading programming model—improved reasoning skills, and the agentic ability for the model to navigate desktops, browsers, and software applications autonomously.

The model is rolling out on March 5 to ChatGPT Plus, Team, and Pro subscribers, as well as through the company’s API. A more powerful version, GPT-5.4 Pro, is also available for users who need maximum performance on complex tasks.

Alongside the model launch, OpenAI is introducing ChatGPT for Excel and Google Sheets in beta, a version of ChatGPT embedded directly in spreadsheets to build, analyze, and update complex financial models. The company is also launching new ChatGPT app integrations—including FactSet, MSCI, Third Bridge, and Moody’s—designed to let teams pull market, company, and internal data into a single workflow.

It also puts OpenAI in more direct competition with rival Anthropic, which launched similar products as part of the Claude for Financial Services launch in July 2025 that were expanded on later in the year. Both companies are racing to capture the enterprise market with tools that can do real-work for sectors ready to adopt AI.

The new announcement could also spark a fresh wave of investor anxiety about the impact of AI on traditional financial data providers, many of whose stocks have already been affected by broader fears of AI-driven disruption to enterprise software. Earlier this year, the release of Anthropic’s Cowork plug-ins triggered a broad selloff across SaaS stocks, as markets spooked on the idea that AI tools could make legacy software providers obsolete.

New agentic capabilities

One of the most significant aspects of GPT-5.4 for enterprise customers is the out-of-the-box agentic capabilities. The model can operate computers and software autonomously, search for and use external tools on demand, and handle complex, multi-step tasks, all without developers having to build that infrastructure themselves.

OpenAI says GPT-5.4 is the company’s most factual and reliable model to date. The company said in a blogpost they had reduced the rate of hallucinations, with individual claims 33% less likely to be false and full responses 18% less likely to contain errors compared to GPT-5.2.

“Developers don’t just need a model that writes code. They need one that thinks through problems the way they do. We’re seeing GPT-5.4 perform exceptionally well at logical reasoning and executing intricate, multi-step, tool-dependent Workflows,” Mario Rodriguez, Chief Product Officer at GitHub, said of the model.

These new features position OpenAI as a more direct player in the increasingly competitive field of agentic products, such as Perplexity Computer, Microsoft’s Copilot Tasks, and OpenClaw. As demonstrated with the recent popularity of OpenClaw, users are increasingly looking for AI systems that can handle extended workflows with minimal human intervention.

OpenAI also says GPT-5.4 is significantly more token-efficient than its predecessors—meaning it uses fewer tokens to solve problems. Despite being priced slightly higher per token than GPT-5.2, OpenAI says those efficiency gains mean it requires fewer tokens to complete many tasks, which could offset the higher cost for some users.

财富中文网所刊载内容之知识产权为财富媒体知识产权有限公司及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
0条Plus
精彩评论
评论

撰写或查看更多评论

请打开财富Plus APP

前往打开