GPT-5来了,牛皮吹破,太平庸
如果拿到“人类最后的考试”中测验,GPT-5的成绩比ChatGPT Agent好一些,可是ChatGPT Agent也没有好到哪里去。“人类最后的考试”是针对大语言模型的基准测试,由2500个前沿学术难题组成。截至2025年6月5日,拿下测试冠军的是谷歌的Gemini 2.5 Pro Preview,OpenAI的o3(high)排第二。“人类
GPT-5来了,牛皮吹破,太平庸
拿自家产品比较的话,GPT-5是没有推理能力的o4.5,GPT-5-mini是没有推理能力的o4.5-mini,GPT-5-nano本质上是GPT-4.2。GPT-5-thinking是带有少量推理能力的o4.5,GPT-5-pro是带有并行推理能力的o4.5,而o4.5是带有推理能力的GPT-4.5+。 如果拿到“人类最后的考试”中测验,GPT-5的成绩比ChatGPT Agent好一些,...
GPT-5来了,牛皮吹破,太平庸
拿自家产品比较的话,GPT-5是没有推理能力的o4.5,GPT-5-mini是没有推理能力的o4.5-mini,GPT-5-nano本质上是GPT-4.2。GPT-5-thinking是带有少量推理能力的o4.5,GPT-5-pro是带有并行推理能力的o4.5,而o4.5是带有推理能力的GPT-4.5+。 如果拿到“人类最后的考试”中测验,GPT-5的成绩比ChatGPT Agent好一些,...
GPT-5来了,牛皮吹破,太平庸__财经头条__新浪财经
拿自家产品比较的话,GPT-5是没有推理能力的o4.5,GPT-5-mini是没有推理能力的o4.5-mini,GPT-5-nano本质上是GPT-4.2。GPT-5-thinking是带有少量推理能力的o4.5,GPT-5-pro是带有并行推理能力的o4.5,而o4.5是带有推理能力的GPT-4.5+。 如果拿到“人类最后的考试”中测验,GPT-5的成绩比ChatGPT Agent好一些,...
GPT-5发布:创新又平庸的一代
但平庸就平庸吧,不能否认的是,GPT-5在价格方面的确是诚意满满。首先,是对C端用户,可以免费使用GPT-5,虽然有使用次数的限制,但限制的数额相当慷慨。达到限额后,也会切换到GPT-5 mini上,而对Plus用户来说,完全足以满足日常的使用。对API用户来说,GPT-5每百万token的输入价格为1.25美元,输出价格则为...
#GPT-5模型被评价为平平无奇##OpenAI遭... 来自南风窗 - 微博
但山姆·奥特曼的“大话”又不得不说:GPT-5难产了一年多;十多名核心人才接连被扎克伯格斥重金挖走;勉强开源两个小模型保住“Open”的头衔……归根结底,OpenAI的现金流要如何支撑1分钟烧掉1.5万美元的消耗? 后又有追兵,OpenAI面对内忧外患,焦虑已经弥漫开来。#洞见计划# °GPT-5来了,牛皮吹破,太平庸 ...
GPT5史诗级大更新,无聊
等了一年多,北京时间8月8日凌晨1点多,在全球瞩目中,OpenAI终于正式发布新一代大语言模型GPT-5,并破天荒地向所有用户免费开放基础版。OpenAI CEO山姆·奥特曼在发布会上表示:“如果说GPT-4还只是大学生,GPT-5就是一位真正的专家。”他将这次升级比作“让我再也回不去”的技术飞跃,就像第一款配备视网膜屏的...
奥特曼首晒GPT-5实测!被曝使用超级对齐团队“遗产”
更扎心的是,就像之前所有AI模型一样,GPT-5发布后很可能会"越用越笨"。这不免让人想起网友的神吐槽:"买AI就像买水果,刚上市时最甜,放一周就不新鲜了"。眼看各路消息越传越玄乎,OpenAI这次怕是骑虎难下了。毕竟牛皮都吹出去了,要是最后放个哑炮,那得多尴尬?不过话说回来,AI发展这么快,谁知道...
GPT-5基准测试泄露,被曝两天后发布?复刻Minecraf
视频里GPT-5操控游戏角色那叫一个行云流水,走位风骚得跟职业选手开小号似的。围观群众纷纷表示:"这水平不去打电竞真是屈才了!"难怪测试者激动得语无伦次,搁谁看见这场面不得喊声"卧槽"?现在全网都在等正式发布,压力全给到OpenAI这边了——牛皮吹得震天响,到时候要是翻车可咋整?有趣的是,关于GPT-5到底...
GPT-5 发布即翻车?赢了第一却被群嘲,普通人该薅的羊毛在这
先上结论:GPT-5确实拿了第一,但水分有点大。在权威榜单LMArena上,它以微弱优势超过谷歌Gemini 2.5 Pro,重新坐上头把交椅。但你猜分差多少?不到3分。就像班里第一名考了98,第二名97,吹成「碾压」多少有点心虚。马斯克显然也看出来了。发布会刚结束,他就转发了两条帖子阴阳怪气:「哟,GPT-5在ARC...
一文读懂GPT-5发布会|价格屠夫、编程惊艳,新功能乏善可陈 - 知乎
之前在各种泄露中被广泛认为会大幅提升的多模态能力方面,GPT-5的提升也并不太显著。 而且与Gemini 这种大一统模型不同,GPT-5仍然是一个主要能进行文字和图像理解的模型。当下,它仍然不支持音频输入/输出和图像生成,视频就更别说了。 想短期内能追上刚发布的Genie 3,看起来对OpenAI来说还是太难了。 一些惊喜:超低幻觉、上下文大跃进 虽然
GPT-5 人人可用,一手实测来了/理想回应出现大量负面评价/微信:真...
今天凌晨,OpenAI 正式发布了 GPT-5,CEO Sam Altman 为其「站台」:GPT-5 是全球最佳模型。 👍 我们也在第一时间实测了 GPT-5:用了半天 GPT-5,写作编程让我又爱又恨,200 刀的最强 Pro 版本到底值不值 官方宣称 GPT-5 在所有方面都碾压前代,并且引入了一个全新的「智能路由」系统,懂得何时「快问快答」...
实测GPT-5:写作“AI味”浓,代码“美而无用”,OpenAI为何急于打响...
“GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。”AI营销与销售专家、太和智库研究员唐兴通在接受每经记者采访时分析指出,“我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。”他认为,AI的发展正面临两大物理限制:“我们必须清醒...
GPT-5颠覆认知首次融合o系列,实测效果远超预期
GPT-5风暴将至这回奥特曼还能“溜人”几次?都说科技圈的风,比东北的二人转还热闹。最近,GPT-5要来了的消息在网络上炸开了锅——你要是没在朋友圈、群聊、刷个短视频里刷到GPT-5的风吹草动,那都不好意思跟人说自己混IT圈。光看那些“偶遇GPT-5”的截图,像极了黄大仙深夜找人聊天,每次都让人一惊一...
ChatGPT-5 来了:从狂热赞美到理性质疑
随着GPT-5的到来,各行业的早期采用者有望进一步扩大领先优势,他们能够利用GPT-5更准确的分析、更强的创意生成和更长的上下文理解,来重塑业务模式。例如,投行可以借助GPT-5快速分析海量财报并生成洞见,电商客服可通过GPT-5实时为顾客提供复杂问题的解决方案,制药公司则能利用GPT-5来设计和解析实验报告。与此同时...
“最强模型”GPT-5发布后评价褒贬不一,奥特曼回应
一些用户认为GPT-5写作更差 在缺乏更明确评估标准的情况下,模型之争有时更多靠感觉来判断。如今每周有近7亿人使用ChatGPT,难免会有人对模型的表现感受不一。要评估一个新AI系统对个人生活与工作的价值,短短一天时间远远不够。宾夕法尼亚大学沃顿商学院教授伊桑·莫利克(Ethan Mollick)经常试用各类AI模型,他对...
“还我GPT-4o”!奥特曼强推GPT-5惹怒网友,紧急公关来了
特别是OpenAI一刀切替换所有模型后,GPT-4o反而被网友们纷纷招魂。原因无他,GPT-5太人机。对话生硬、长文本理解不足、写作创意不够……现在的GPT-5更像是AI助手,而不是类似GPT-4o一样给予情感链接的朋友。而且这也太像一声不吭就断崖式“分手”的前任了吧?一声招呼就不打,OpenAI直接关闭既往所有型号,连缓冲...
发布会出错又无聊的GPT-5,实测下来强的可怕
连接 Gmail、Google Calendar 等 MCP 能力来提高记忆能力,也是很多大模型的标配了。而且,GPT-5 主要强调的都是实用层面的特性,不像 GPT-4、Claude 3.5 Sonnet 等突破极限的进展更能给人带来惊喜。但知危还是抱着好奇去 Cursor 上试了一下( 现在就能免费在 Agent 模式中用 GPT-5 ),结果发现:真的太...
GPT-5发布,这一次OpenAI没有颠覆式创新
GPT-5终于来了,但比所有人的预期都要晚。据新华社报道,美国开放人工智能研究中心(OpenAI)8月7日发布其最新人工智能模型GPT-5。▲OpenAI发布其最新人工智能模型GPT-5。图/IC photo 从2023年3月GPT-4横空出世之后,不少人曾认为,当年下半年GPT-5就可以出来。但这一等,就是2年多的时间。期间,OpenAI推出了...
炸裂!GPT-5 横空出世:“学霸级”AI 掀起 AI 圈新狂澜
这种设计简直太牛了,仿佛造出了一个拥有超级智能的机器人。二、GPT-5 实力大揭秘:全方位的“技能王者”(一)基准测试全领先,实力稳如泰山 GPT-5 在各项基准测试中的成绩就像夜空中最璀璨的星星,格外耀眼。在网页开发领域,它就像一位技艺精湛的建筑大师,创造出了新的纪录,将 Gemini-2.5-pro 和 Claude-...