每经编辑 | 杜宇
美国开放人工智能研究中心(OpenAI)于12月11日发布了其人工智能模型GPT的最新升级版本——GPT-5.2,以应对生成式人工智能领域日趋激烈的竞争。

为回应谷歌公司11月发布的人工智能模型双子座3的出色表现,OpenAI首席执行官萨姆·奥尔特曼近日启动“红色警报”,加快GPT升级版本的发布速度。
OpenAI今年8月推出了GPT-5,11月紧接着发布了升级版本GPT-5.1,而不到一个月后又再次更新。业内人士认为,这一频繁更新的策略凸显了人工智能行业当前面临的激烈竞争压力。

GPT-5.2是OpenAI迄今为止最先进的人工智能(AI)模型,针对专业工作场景进行了全面优化,刷新了多个基准测试的行业记录。其中,GPT-5.2 Thinking在SWE编码能力测试中取得了历史最高分,也是OpenAI首个性能达到或超过人类专家水平的模型。
OpenAI介绍称,GPT-5.2是迄今为止在“专业知识工作方面”表现最好的模型系列。无论是制作电子表格、制作演示文稿、图像感知、编写代码,还是理解长上下文,GPT-5.2均优于前代产品,旨在“为人们创造更多经济价值”。OpenAI研究副总裁Adain Clark表示,GPT-5.2在数学推理上的进步使其能够更好地处理金融建模、预测和数据分析等任务。
OpenAI宣布,12月11日当天,GPT-5.2已在ChatGPT上线,面向Plus、Pro、Go、Business和Enterprise付费套餐用户,共推出Instant、Thinking和Pro三个版本,同时API也同步开放给所有开发者。
在ChatGPT平台,付费用户可使用三种版本的GPT-5.2,且在未来三个月内仍可继续访问GPT-5.1。在API平台上,GPT-5.2的定价为每百万输入token 1.75美元、每百万输出token 14美元,缓存输入可享受90%的折扣。虽然单token价格高于GPT-5.1,但OpenAI称,由于模型效率更高,达到相同质量水平的总成本反而更低。
OpenAI介绍,Instant版本是快速高效的日常工作与学习助手,在信息查询、操作指南、技术写作和翻译方面表现显著提升,并延续了GPT-5.1 Instant中更亲切的对话风格。早期测试者尤其指出,GPT-5.2的解释更加清晰,能够直接呈现关键信息。
Thinking版本专为深度工作设计,能帮助用户更高效地完成复杂任务,特别是在编码、总结长篇文档、回答上传文件相关问题、逐步进行数学和逻辑运算,以及提供更清晰的框架与丰富细节以辅助规划和决策方面表现突出。
Pro版本适合需要高质量解答难题的场景,是“最智能、最可靠”的选择。早期测试显示,它在编程等复杂领域表现更为出色,且出现重大错误的概率更低。

在多个关键基准测试中,GPT-5.2刷新了行业纪录。其在GDPval测试中涵盖44个职业的知识工作任务中,表现有70.9%达到或超过行业专家水平。OpenAI表示,GPT-5.2 Thinking执行这些任务的速度是专家的11倍以上,成本不到专家的1%。
在编码能力方面,GPT-5.2 Thinking在SWE-Bench Pro测试中成绩为55.6%,在SWE-bench Verified测试中则达到80%,创下新高。此基准涵盖真实世界的软件工程任务,涉及四种编程语言。OpenAI产品负责人Max Schwarzer指出,GPT-5.2在代码生成和调试方面取得了重大进步。编码初创公司Windsurf和CharlieCode均报告称该模型实现了“最先进的智能体编码性能”。

OpenAI声称GPT-5.2 Thinking是“世界上最好的视觉模型”,在图表推理和软件界面理解方面的错误率降低了约一半。长文本处理能力也得到显著提升,该模型在OpenAI MRCRv2测试中率先实现了在25.6万token范围内近100%的准确率,使其特别适合深度文档分析和多源信息工作流。
在科学研究领域,GPT-5.2 Pro在GPQA Diamond测试中达到93.2%的准确率,GPT-5.2 Thinking紧随其后,为92.4%。在专家级数学测试FrontierMath中,GPT-5.2 Thinking解决了40.3%的问题,创下新纪录。OpenAI称GPT-5.2 Pro和GPT-5.2 Thinking为“世界上最好的科学家助手模型”。
作为对谷歌的反击,GPT-5.2仅是OpenAI打出的“第一拳”。
公司CEO萨姆·奥尔特曼在12月11日宣布,下周将为用户送上一些“小小的圣诞礼物”。他表示,Gemini 3对公司各项业务指标的影响低于预期。同时,他预计OpenAI将在2026年1月“以非常强劲的姿态”退出当前的红色警报状态。

OpenAI首席产品官Fidji Simo于12月11日透露,公司已开始在部分地区推出年龄估算系统,旨在管控ChatGPT对18岁以下用户的回复内容。Simo表示,公司计划在明年第一季度推出“成人模式”之前先行引入此功能。
此前有报道称,OpenAI计划于明年1月发布一款性能更优、图像能力更强且具备更完善个性化特点的新模型,但公司周四未对此传言作出确认。
每日经济新闻综合公开消息
https://finance.sina.com.cn/roll/2025-12-12/doc-inhanutt5982541.shtml