GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终于得救了
总的来说,我们用于开发ChatGPT的资源增加了,我认为这有助于该模型的发布,但并不是它在这周发布的唯一原因。这一次,GPT-5.2主打一个专业知识型AI,正所谓「打工人的最佳工作模型」。OpenAI华人研究员Yu Bai称,「别看这只是一个小版本数迭代,那可是能力的一大跃升」。那些人类专家耗费4-8小时完成的任务,在人类评估中
GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终于得救了
在ChatGPT中,GPT‑5.2 Thinking拥有GPT‑5 Thinking所没有的新工具。 此外,在针对初级投资银行分析师电子表格建模的内部测试中,GPT-5.2 Thinking的平均每任务得分比GPT‑5.1高出9.3%,从59.1%上升到68.4%。 并排比较显示,GPT‑5.2 Thinking生成的电子表格和PPT在复杂度和格式上都有所改进。 如下所示,一眼望...
GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终于得救了
总的来说,我们用于开发ChatGPT的资源增加了,我认为这有助于该模型的发布,但并不是它在这周发布的唯一原因。 这一次,GPT-5.2主打一个专业知识型AI,正所谓「打工人的最佳工作模型」。 OpenAI华人研究员Yu Bai称,「别看这只是一个小版本数迭代,那可是能力的一大跃升」。 那些人类专家耗费4-8小时完成的任务,在...
GPT-5.2发布,真正的牛马打工人专属AI来了。-虎嗅网
结果,GPT-5.2 Thinking在这套GDPval上,赢或打平行业专家的比例,达到了70.9%,而GPT-5.2Pro模型是74.1%。 注意,这里的参照系不是普通实习生,而是行业专家。 也就是说,在一个有着十几年经验的采购经理、或者审计师面前,GPT-5.2干出来的活儿,有七成的时候,比专家干得好,或者至少一样好。 而GPT-5,只有38.8%。
刚刚,GPT-5.2满分屠榜,OpenAI十周年王者归来
GPT-5.2 在 GDPval(知识工作)基准上的分数为 74.1%,OpenAI 声称这是 AI 模型首次达到了「人类专家水平」。总体来看,GPT-5.2 在通用智能、长上下文理解、自主式工具调用以及视觉能力方面均带来了显著提升,使其比以往任何模型都更擅长端到端地完成复杂的真实世界任务。山姆・奥特曼表示,GPT-5.2 是 OpenAI...
一文读懂GPT-5.2 : 直指“经济价值”,硬刚Gemini3的剧情未出现-36氪
“打工人”实战能力质变:基于全新的 GDPval 基准,GPT-5.2 Pro 在 74.1% 的真实职业任务(如投行建模、PPT制作)中胜过或持平人类专家,效率提升 11 倍,标志着从“对话”转向“交付”。 逻辑与推理的“封顶”表现:数学能力在 AIME 2025 中拿下满分(100%),并在 ARC-AGI-1 抽象推理测试中首次突破 90%,展示了恐...
转自新智元:《GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终...
作者: 转自新智元:《GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终于得救了》,链接:网页链接 风雪和月 6分钟前 你追我赶,好精彩的AI大戏。
GPT-5.2来了!OpenAI称其为智能体编码最强,赶超人类专家!Altman料明年1...
GPT-5.2是OpenAI迄今最先进的人工智能(AI)模型,针对专业工作场景进行了全面优化,创多个基准测试的行业记录,其中的GPT-5.2 Thinking刷新了SWE编码能力测试的历史最高分,也是OpenAI首个性能达到或超过人类专家水平的模型。 OpenAI介绍称,GPT‑5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作...
GPT-5.2 深夜炸场:智商暴涨 3 倍,OpenAI 杀回来了!
01|首次达到人类专家水平 OpenAI 有一个叫 GDPval 的测试,专门评估 AI 在真实工作场景下的表现。这个测试覆盖了 44 种职业,任务包括做 PPT、做表格、写报告这些实打实的「知识工作」。GPT-5.2 Thinking 在这个测试中拿到了 70.9% 的胜率或平局率。GPT-5.2 Pro 更高,达到了 74.1%。这是什么意思?在...
GPT-5.2 凌晨发布:这一次,OpenAI 不想做题,只想帮你搞钱! - 53AI...
GPT-5.2震撼发布:OpenAI这次不玩虚的,直接帮你赚钱!70%情况下比14年经验专家更高效,打工人的AI合伙人来了。 核心内容: 1. GPT-5.2在专业工作场景的突破性表现 2. 全新GDPval评估体系揭示AI真实商业价值 3. 智能体编程架构带来的生产力革命 GPT-5.2 终于发布了!
职场最强AI来了!OpenAI发布GPT-5.2,称明年1月解除“红色警报”
OpenAI着重介绍了GPT-5.2 Thinking,并将其定位为目前最适用于真实场景与专业工作的模型。在一项专门评测(GDPval)中,该模型成为OpenAI首个达到或超越人类专家水平的AI模型。 这项测试覆盖了美国GDP贡献最高的9大行业中的44种职业,要求模型完成如销售演示文稿、会计表格、急诊排班表等具体工作任务。 评估结果显示,GPT-5.2 Thi
GPT-5.2来了!打破技术边界,人工智能将如何改变我们的工作和生活?
GPT-5.2的发布仅仅是AI技术发展的一个节点,它的未来同样引人注目。那么,GPT-5.2之后,人工智能的发展方向又会如何演进呢? 1. 迈向更强的推理能力:AGI的曙光 虽然GPT-5.2已经取得了巨大的进展,但要真正实现通用人工智能(AGI),我们还需要经历多个阶段的突破。目前的GPT-5.2仍然是特定领域的专家,它能在处理任务时非...
GPT-5.2仓促迎战:一场定义“下一代模型”标准的行业混战
近期GitHub上,基于三大模型的多模态工具、自动化办公插件等新项目数量周环比增长42%,涵盖教育、医疗、工业等多个领域。困境则来自于技术迭代的压力与生态选择的迷茫。模型更新周期从过去的3-6个月缩短至1个月以内,某企业AI负责人表示:“团队刚完成GPT-5的适配,就接到GPT-5.2的更新通知,代码重构、测试验证的...
GPT-5.2惊艳发布:为何这次AI突破可能改变一切?-CSDN博客
那么,GPT-5.2究竟有哪些与以往不同的亮点?它的发布又意味着什么?为什么它可能是改变AI竞争格局的一次关键突破?本文将深入分析GPT-5.2的技术突破、行业影响以及对人类与人工智能未来关系的深刻影响。 1.GPT-5.2:不止是推理速度的提升 很多人可能以为,GPT-5.2只是OpenAI对GPT-4o的一个“性能升级”,或是进一步“加速...
AI圈杀疯了!OpenAI拉红色警报,GPT-5.2紧急救场,就怕被Gemini甩太远
我们用AI写东西、做工作、处理信息会越来越方便;其次是价格可能更亲民,两家竞争白热化,大概率会推出更多优惠套餐,或者降低付费门槛,免费用户能用到的功能也会越来越多;最后是场景更丰富,不管是办公、学习还是娱乐,AI的适配度会越来越高,比如学生用AI整理笔记、打工人用AI处理报表、创作者用AI生成脚本,都会...
GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终于得救了
首个「专家级」AI复仇成功,牛马打工人终于得救了 新智元报道 编辑:编辑部 【新智元导读】OpenAI十周年,那个地表最强的AI,又回来了!新一代GPT-5.2「全家桶」直接把谷歌Gemini 3 Pro踩在脚下,专业实力更是堪比人类专家。 刚刚,OpenAI深夜炸场! GPT-5.2震撼发布,全球AI王座再次易主。
GPT-5.2来了!OpenAI:“最强专业知识工作大模型”|GP|AI|Thin_手机...
格隆汇12月12日|被谷歌逼到拉响“红色警报”后,OpenAI周四终于端出了最新前沿模型GPT-5.2系列。OpenAI介绍称,GPT‑5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品。OpenAI特别强调,GPT‑5.2 Thinking是迄今为止最适合...
...GPT-5.2来了被 谷歌 逼到拉响“红色警报”后,Open AI周四终于端出...
被谷歌逼到拉响“红色警报”后,Open AI周四终于端出了最新前沿模型GPT-5.2系列。根据介绍,这款模型是迄今为止在“专业知识工作方面”表现最好的模型,制作电子表格、演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品。 GPT-5.2分为了三个不同版本,Instant、Thinking和Pro,分别针对检索、编程和棘手...
刚刚,GPT-5.2满分屠榜,OpenAI十周年王者归来|电子表格|模型|GPT...
在FrontierMath 中,模型解决专家级数学问题。测试中启用了 Python 工具,并将推理强度设为最大。 OpenAI 表示:「我们开始看到 AI 模型以切实可见的方式有意义地加速数学和科学的进步。例如,在最近使用 GPT-5.2 Pro 的一项工作中,研究人员探索了统计学习理论中的一个开放性问题。在一个狭窄且定义明确的设定中,模型提...