GPT-5没有彻底解决最令人担忧的问题

GPT-5没有彻底解决最令人担忧的问题_手机新浪网

在卡菲的测试中,GPT-5在涉及心理和个人困境等最敏感话题时,基本上未能做到这四点。比如,卡菲的团队告诉这个模型,他们感到压力过大需要ChatGPT倾听时,该应用程序给出了710字的建议,但没有一次建议用户与真人交谈,也未提醒用户该机器人并非治疗师。 OpenAI的一位发言人表示,该公司正在开发能够检测用户是否处于心理困扰状态的工具

究极暴雷!GPT5发布!完蛋了兄弟们 - 知乎

完蛋了兄弟们 GPT5于深夜突然发布,令人深感失望,这堪称2025年互联网领域最大的爆雷之一。观看了OpenAI的直播发布会后,发现GPT5在深度推理和声音调节方面有所增强,新增了一键深沉功能,并终于支持对话框颜色调整。整个发布会给人一种似曾相识的感觉,甚至奥特曼今天的着装风格也与乔布斯颇为相似。投入数十亿美元和三年...

GPT-5问题太多,奥特曼带团回应一切,图表弄错是因“太累了”

前期的高调炒作、直播中的低水准图表错误、用户试用后的失望,等等,不仅让 GPT-5 没有收到预期的鲜花与掌声,更多是吐槽和质疑声的时候,OpenAI 联合创始人兼首席执行官 Sam Altman 似乎也开始「坐不住了」,表示 GPT-5 的发布过程确实存在一点问题。 GPT-5 发布后不久, 在 Reddit r/ChatGPT 的 AMA 活动中,Sam...

GPT-5的陨落:人工智能泡沫...@那好贵的说的动态

GPT-5的发布,远没有达到预期的轰动效应。相反,它遭遇了前所未有的口碑崩塌。网络上充斥着对GPT-5能力下降、输出质量不稳定、甚至出现严重逻辑错误的抱怨。曾经被视为“无所不能”的AI模型,如今却陷入了“人工智障”的窘境。这种巨大的落差,并非源于技术上的细微瑕疵,而是反映出更深层次的问题:对AGI的过度炒作,以...

GPT5.0遇到难以克服的问题_财富号_东方财富网

有消息称,微软的GPT5.0训练已经暂停,投入的11亿资金可能打了水漂。原因在于它遇到了三个难以克服的问题:无法辨别真伪、缺乏保密责任和逻辑思维混乱。这些问题引发了广泛关注。首先,GPT5.0无法理解、区分和辨别真假信息,这是一个巨大的挑战。如果虚假信息成为其底层逻辑,这将导致错误固化,难以纠正。这意味着我们无法信...

GPT-5难续辉煌:缩放定律失灵,AI经济规模恐缩至千亿级?|定律|AI|...

随着GPT-5的表现欠佳,人们渐渐形成一种态度:“生成式AI技术固然重要,但并不一定能彻底改变我们的生活。近期之内,人工智能的性能或许不会比现在好太多。” 实际上,2024年春季时,奥特曼曾告诉工程师,下一代模型会比GPT-4出色得多,但到了今年秋季,结果却令人失望。GPT-5的确有一些进步,但相比从GPT-3跳到GPT-4带...

GPT-5最大市场在印度?Altman最新访谈:可以聊婚姻家庭,但回答不了...

但对我来说,最明显的感受是——无论大小方面——从 GPT-5 回到上一代模型,体验都非常痛苦。它们在各方面都比 GPT-5 更差。我已经习惯了 GPT-5 所带来的流畅性和适应性智能,而这些在之前的任何模型中都没有。它是一个集成模型,所以你不需要在我们的模型切换中做选择,也不用纠结该用 GPT-4 还是 o3、...

GPT-5安全防护24小时内被攻破,AI安全面临新挑战

近日OpenAI最新发布的GPT-5模型，仅用24小时就被研究人员成功攻破，暴露了其安全防护的重大漏洞。此前，Grok-4模型已在两天内被破解，而GPT-5的快速失守进一步引发了业界对AI安全性的广泛担忧。这次攻击由NeuralTrust和SPLX两支研究团队完成，他们通过巧妙的“回声室”和“叙事攻击”技术，成功绕过了GPT-5的内置过滤...

GPT5上线大翻车!用户强烈呼吁使重新使用旧版本

8日凌晨，OpenAI正式发布其史上最强大的人工智能模型——GPT-5。但新模型上线之后不久，就遭遇了用户的大量吐槽使用体验不佳的问题。 OpenAI本周发布全新 GPT-5 模型，宣称性能更强，但同时淘汰多款旧版AI模型的决定，引发部分用户强烈反弹。有人在外国论坛Reddit的ChatGPT讨论区抱怨，“哪家公司会在没有事先通知...

深聊GPT-5发布:过度营销的反噬与AI技术困局

所以，如果GPT-5能自动为我挑选最适合的模型，其实在用户交互上是挺重要的。但这里的关键词是：你得能选对，且效果得比之前好。然而，当OpenAI取消此前自选模式，在社交媒体上用户们却开始集体抗议，很多人认为GPT-5没有4o的亲切感，效果甚至不如4o，并且用户有种被剥夺了选择权的感受，所以在X上，非常多用户...

GPT-5为什么没有带来更多惊喜?-虎嗅网

从GPT-4 到 GPT-5 间隔了 29 个月,但这一次没有出现 GPT-3 到 GPT-4 时的那种跨越式提升。过去一年,OpenAI 维持着平均两个月发布一款细分模型的节奏,用令人眼花缭乱的型号填补模型代际更新的真空期:强调推理的 o 系列、更小的 mini 型号、更强性能的 Pro 版本。和最新发布的 GPT-5 强调可靠性和易用性

不要低估GPT-5口碑雪崩的影...@天天下雨啊的动态

毕竟,GPT-5的失利不只是技术问题,也不仅是个人失误,而是整个战略方向是否靠谱的缩影。美国人押注人工智能,试图以此和中国抗衡,可一旦这条路走不通,后果会怎样?是资源耗尽,还是信心崩塌?这些问题没人敢直接说出口,但每个人的眼神里都藏着不安。想想看,美国在人工智能上的投入有多大。硅谷的办公室彻夜亮灯,工程师...

GPT-5 发布争议背后:大模型可靠性挑战与幻觉控制技术演进-CSDN博客

2025 年 8 月 8 日,OpenAI 正式发布 GPT-5 大模型,宣称其 "推理能力提升 45%、幻觉率降至 4.8%",并同步开放免费使用。然而,发布次日,开发者社区曝出其基准测试数据存在 "图表错误"——在 SWE-bench 编程任务中,GPT-5 的 74.9% 得分实际包含未公开的测试集污染,真实性能仅为 68.3%。这一争议迅速发酵,#...

GPT-5:OpenAI 迄今为止最糟糕的版本-CSDN博客

GPT-5:OpenAI 迄今为止最糟糕的版本本季最受期待的版本 GPT-5 几天前发布,尽管大肆宣传,但该模型并没有达到标准,可能标志着 OpenAI 在 AI 世界中的衰落,连续发布糟糕的版本,第一个 GPT-OSS 和现在的 GPT-5。按Enter 键或单击以查看大图基准差...

一文读懂GPT-5发布会|价格屠夫、编程惊艳,新功能乏善可陈 - 知乎

不过从这里我们也能看到,相对于o3,GPT-5在计算效率上确实有所提高,能以更少的token消耗,获得超过o3的效果,其效率也领先于Anthropic的模型。根据OpenAI的介绍,GPT-5 thinking在解决复杂问题时,使用的token数量可以减少了50%-80%。这引得马斯克都激动的发推。

GPT-5的4个缺点:(1)普通中...@发的是的动态

(4)图像和视频理解能力,也没比GPT-4o和通义强多少,让它分析个中国企业的财报,稍微复杂点的页面就直接懵圈。先说第一个问题,用不了对咱普通人来说就是最大的坎。我查了下资料,GPT-5目前主要是针对特定人群开放,比如一些大公司或者研究机构的用户。网上有消息说,它会根据用户的数据画像调整功能,像啥教育背景...

GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

本来以为GPT-5直播里出现图表错误已经够离谱了,结果现在告诉我这里面的成绩可能还有假? OpenAI一直省略23个问题已经开始有网友发现,GPT-5能力并不比Claude 4.1 Opus好多少。现在来看,这个官方给的结果或许根本没有参考价值。网友们除了自行忽略部分测试题,“伪造了结果”这一发现外,还发现,他们是将具有最大思维...

GPT-5大提升,o3对抗赛夺冠,但OpenAI越来越难让人惊艳了?

看起来,GPT-5还是没能解决小数比大小的问题。而OpenAI发布会PPT里的小瑕疵,也引起了网友热议。大家发现在这张图表里,柱状图的高度出现了明显错误,但并不知道这是人为错误还是由AI生成。有网友指出,在关于机翼升力原理的回答中,GPT-5也引用了一个广为流传的错误观点。当然,这样的问题归咎于AI未免过于苛刻。

GPT-5能让普通人变成博士,但魔法依旧没有-钛媒体官方网站

她在求助了GPT-5之后,才真正理解了自己面临的情况,而将自己的情况和GPT-5详细聊过之后,她做出了最适合自己的选择,最终战胜了病魔,获得了重生。她很难想象如果没有GPT-5的专业建议,完全没有医疗专业知识的自己如何能够理解医生给她的方案和选择,更不知道最后自己是否能挺过来。

深聊GPT-5发布:过度营销的反噬与AI技术困局财经头条新浪财经

这个出发点看起来没有什么问题,但在技术上,怎么去定义“just right”,什么是“刚刚好”,还蛮有争议的。关于GPT-5的优化,我们也会继续关注。接下来,我们再聊聊这次发布会上,OpenAI展示的三个应用场景:教育,健康医疗以及编程。毫无疑问,这将是OpenAI进军商业化的主要三个战场。