4月24日凌晨,OpenAI發布了其最新一代大模型 GPT-5.5,距離上一次重大更新僅過去一個多月。
OpenAI團隊認為,“這是我們迄今為止最智能、最直觀易用的模型,也是邁向在計算機上完成工作的全新方式的重要一步。”
似乎是為了證明這款產品的顛覆性,OpenAI在介紹中引用了一位英偉達工程師的內測感受:“失去GPT-5.5,就像被截肢。”
上月,OpenAI宣布完成規模達1220億美元的私募融資,估值高達8520億美元,創下全球AI企業估值新紀錄。但企業市場上,OpenAI的市場份額正被Anthropic以驚人的速度蠶食,隨后OpenAI又忍痛砍掉了曾轟動世界的視頻生成項目Sora,并進行了一場傷筋動骨的業務重組。
在2026年的這個時間節點,對于OpenAI來說挑戰不小。看起來像是常規技術迭代的發布,底色更像一場自救。

更強、更快、也更貴
回顧生成式 AI 過去幾年的發展歷程,用戶早已習慣了一個潛規則:每一次模型升級,幾乎都伴隨著不可忽視的“變慢”和“變貴”。更大的參數量、更長的思考時間,似乎是為“智能”支付的隱性代價。
但 GPT-5.5 的主打賣點,恰恰是打破了這條鐵律。
OpenAI宣稱,在真實的生產環境中,GPT-5.5 不僅智能水平大幅躍升,其每Token延遲與上一代GPT-5.4基本持平,甚至由于推理效率的優化,完成同樣的復雜任務所需的Token數量反而更少。
在具體能力上,據介紹,GPT?5.5 是OpenAI迄今為止最強的智能體編碼模型。在測試復雜命令行工作流的Terminal-Bench 2.0上,它取得了82.7%的當前最優準確率。在評估真實GitHub問題解決能力的SWE-Bench Pro上,它的準確率達到58.6%,一次性端到端解決的任務數量超過了以往的模型。
其在編碼方面的優勢在Codex中體現得尤為明顯,它能夠承擔從實現、重構到調試、測試及驗證等一系列工程工作。早期測試表明,GPT?5.5在實際工程工作所依賴的多項能力上表現更佳,例如在大型系統中保持上下文連貫性、在模糊的故障場景中進行推理、借助工具驗證假設,以及在相關代碼庫中同步完成變更。
參與測試的高級工程師表示,GPT?5.5在推理和自主性方面明顯強于GPT?5.4和Claude Opus 4.7,能夠在不需明確提示的情況下提前發現問題,并預判測試與代碼審查的需求。
“GPT-5.5比GPT-5.4明顯更聰明、更持久,編碼性能更強,工具使用也更可靠。它能夠在不提前中斷的情況下持續處理任務的時間顯著更長。”Cursor聯合創始人兼首席執行官Michael Truell表示。
不過,對于華爾街和開發者來說,最敏感的還是定價。
GPT-5.5的API價格并不美麗。輸入每百萬Token定價5美元,輸出30美元,比GPT-5.4整體貴了一倍。若需要更強的Pro版本,價格更是高達輸入30美元、輸出180美元。
OpenAI的邏輯是,每個任務需要的Token更少,實際總成本可能不升反降。這一判斷得到了英偉達方面的驗證:在GB200 NVL72系統上運行的GPT-5.5,相比前代系統,每百萬Token成本降至1/35,每兆瓦Token輸出量提升50倍。
不過,這依然是一道不低的門檻。在AI Infra成本成為各家生死線的今天,抬高價格無疑會將一部分價格敏感、有復雜任務需求的中間開發者推向競品的懷抱。
進軍B端市場
理解了GPT-5.5的產品特性,也就不難理解OpenAI為何選擇在這個時候,以這種形態發布這款模型。
時間倒回到2025年底至2026年初,OpenAI的日子并不好過。
一方面是內部戰略的嚴重失焦。視頻生成明星項目Sora上線半年即宣告關停,其高昂的算力成本(年化超55億美元)與微薄的收入(約210萬美元)形成了極致的反差。試圖在文本、視頻、瀏覽器、硬件等多條戰線全面出擊的OpenAI,陷入了“內部孵化器”式的混亂。
OpenAI應用業務CEO Fidji Simo在3月19日的內部備忘錄中提到,公司過去在多個應用和技術棧上同時投入,導致開發速度放緩,部分產品的質量標準未能達到預期。她強調,當某些業務方向開始顯現成效時,集中資源、避免分散是必要的選擇。
另一方面是競爭對手的精準打擊。尤其是在企業級市場,Anthropic憑借Claude Code等產品實現了驚人的增長,已將OpenAI逼到了墻角。Menlo Ventures的報告顯示,Anthropic占據企業編碼市場54%的份額,OpenAI 僅有21%;在企業級agent市場,Anthropic份額為40%,OpenAI為27%。
Ramp數據顯示,在2026年3月新采購AI服務的企業中,高達65%選擇了Anthropic,僅32%選擇OpenAI。
更要命的是資本的壓力。雖然OpenAI剛剛完成了1220億美元的巨額融資,但這筆錢更像是“續命錢”。一份OpenAI內部報告文件指出,OpenAI預計2026年將虧損140億美元,約為2025年早期預測的三倍。
為了實現最終上市并支撐8520億美元的高估值,OpenAI必須向資本市場講出一個比“聊天機器人第一”更具想象力的新故事。
而 GPT-5.5,就是這個故事的新腳本。
這個故事的劇本重寫了主角。Fidji Simo在全員信中將戰略優先級錨定在Codex,而非擁有9億周活的ChatGPT。背后的邏輯是,C端流量的廣告價值轉化尚不明朗且充滿爭議,而B端企業為生產力工具的付費能力已經被證明了無數次。
因此,GPT-5.5的一切設計,從自主執行多步驟任務的能力,到對代碼和科研場景的優化,無不是在為“智能體”鋪路。OpenAI想要賣的,是一個可以替代初級員工、獨立完成工作流的“數字打工人”。
值得注意的是,GPT-5.5的發布時機正好選在了Anthropic陷入“降智”爭議的節骨眼上。OpenAI首席營收官Denise Dresser甚至在內部備忘錄中直接點名炮轟對手的財務水分和不穩定性。親自下場,也是為了在IPO前夕,向投資人證明自己的增長質量更高、生態更健康。
Denise Dresser還提及,多年期、多產品、上億美元級別的企業交易正在快速增長,而當前最大的瓶頸是產能而非需求,因此Q2的首要任務之一就是加速招聘以支撐擴張。
OpenAI將籌碼幾乎全部壓在B端和智能體上,意味著其要在Anthropic最擅長的領域與其正面交鋒,這注定是一場硬仗。(記者 董靜怡)
來源:21世紀經濟報道
責任編輯:崔現香

請輸入驗證碼