DeepSeek开源数学推理模型达奥数金牌水平,超越谷歌模型10个百分点
11月27日晚间,DeepSeek在HuggingFace平台开源发布新型数学推理模型DeepSeek-Math-V2。这一模型在数学推理领域实现重大突破,成为首个达到国际奥林匹克数学竞赛金牌水平的开源模型。DeepSeek-Math-V2基于DeepSeek-V3.2-Exp-Base构建,采用可自我验证的训练框架。该模型的核心创新在于引入LLM验证器,能够
刚刚,DeepSeek开源新模型,拿下奥数证明题冠军
智东西11月17 日报道,今日,DeepSeek开源了“奥数金牌级”模型DeepSeekMath-V2,该模型具备强大的定理证明能力。DeepSeekMath-V2在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)上取得了金牌水平的成绩;并在2024年普特南大学生数学竞赛(Putnam 2024)上取得了接近满分(118/120...
第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开...
DeepSeek最新发布的开源数学模型,正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型,在被誉为全球最难的高中数学竞赛中达到了金牌水平,成为首个实现这一成就的开源模型,标志着开源人工智能在复杂推理能力上的一次重大突破。昨日DeepSeek宣布推出其最新的数学推理模型DeepSeekMath-V2,该模型在...
DeepSeek上新!首个奥数金牌水平的模型来了
11月27日晚,DeepSeek悄悄地在Hugging Face 上开源了一个新模型:DeepSeek-Math-V2。这是一个数学方面的模型,也是目前行业首个达到IMO(国际奥林匹克数学竞赛)金牌水平且开源的模型。在同步发布的技术论文中,DeepSeek表示,Math-V2的部分性能优于谷歌旗下的Gemini DeepThink,并展示了模型在IMO-ProofBench基准以及...
DeepSeekMath-V2横空出世:开源AI拿下奥数金牌,自我验证让推理漏洞...
2025年11月27日凌晨,当多数人还沉浸在睡眠中时,全球AI领域悄然炸开了一道惊雷——国内AI团队DeepSeek正式对外开源全新数学推理模型DeepSeekMath-V2,这款被业内称为“奥数金牌级”的智能模型,用一连串震撼性的成绩改写了AI数学推理领域的格局。它在2025年国际数学奥林匹克竞赛(IMO 2025)的测评中稳稳拿下金牌水...
DeepSeek开源新数学推理模型,实现奥数金牌水平_ZAKER新闻
日前,DeepSeek 方面开源全新的数学推理模型 DeepSeek-Math-V2。 据了解,该模型在 2025 年国际数学奥林匹克竞赛(IMO 2025)和 2024 年中国数学奥林匹克竞赛(CMO 2024)中取得了金牌水平的成绩,成为第一个在 IMO 级别竞赛中获得金牌水平的开源模型。此外在 2024 年普特南大学生数学竞赛(Putnam 2024)上,该模型取得接...
趁硅谷过节“开大”!DeepSeek上线“奥数金牌”模型!填平谷歌...
就在大洋彼岸的工程师们准备切火鸡庆祝节日时,DeepSeek保持了极客传统,悄然上线了DeepSeekMath-V2。 开源权重、IMO金牌水平、超越GPT-5。这套熟悉的“三连击”,再次巩固了DeepSeek作为“开源灯塔”的地位。在算力受限的背景下,DeepSeek 再次证明了自己:不需要庞大的 GPU 集群,也能用算法奇迹在最硬核的数学赛道上,...
DeepSeek强势回归,开源IMO金牌级数学模型-36氪
突破级推理模型来了,DeepSeek 打开了自我验证的数学推理方向。 The whale is back! 就在刚刚,DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型:DeepSeek-Math-V2。 顾名思义,这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时,这个模型只用 7B 参数量,就达到了 ...
DeepMind和OpenAI模型获得奥数金牌分数
1.质的跨越: 就在去年(2024年),DeepMind 的大语言模型在同类评估中,表现还仅处于银牌得主的上限区间。从“银牌顶尖”跃升至“金牌门槛”,这远非微小的进步,而是 AI 在高级数学推理和问题解决能力上的一次实质性突破。 2.顶级对标: 国际数学奥林匹克竞赛金牌代表着全球高中生在数学领域所能达到的巅峰水平。AI 能...
DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过
首先,Prover-V2 引入了来自自动形式化和各种开源数据集的额外问题,扩大了训练问题领域的覆盖范围。其次,新模型通过子目标分解生成的问题来扩充数据集,旨在解决 MiniF2F 基准测试有效划分中的更多挑战性实例。研究人员在 DeepSeek-V3-Base-671B 上使用恒定的学习率 5e-6,在 16384 个 token 的上下文中进行监督...
DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过
深度求索公司突然开源代号"解题神器"的DeepSeek-Prover-V2,这个专攻数学定理证明的AI系统在奥林匹克竞赛题库里杀疯了,测试数据显示其解题准确率飙到88.9%。消息传出不到三小时,某当红小花的粉丝后援会紧急发起"保护我方关晓彤"行动——原来这位被戏称"方程杀手"的女星,去年在综艺里解二元一次方程翻车的视频又被
GPT-5危了!DeepSeek开源世界首个奥数金牌AI,正面硬刚谷歌
最关键的是,这是首款「开源的IMO金牌模型」。基于DeepSeek V3.2 Exp Base构建 当前,已官宣拿下金牌的两大模型,一款来自谷歌Gemini Deep Think,另一款便来自OpenAI的内部模型。在IMO-ProofBench中,DeepSeekMath-V2展现出强大的定理证明能力:IMO 2025:破解5题(共6题),达到了金牌水平;CMO 2024(中国数...
近年来AI求解国际数学奥林匹克问题的突破性进展 - 知乎
相关报道(量子位):DeepSeek 加持,北大通院几何模型达 IMO 金牌水平!32 个 CPU 核心和 1 块 4090 就能实现满血解题 Gemini 2.5 Deep Think(2025 年 7 月 21 日) 在刚刚过去的 2025 年 IMO 中,DeepMind 的 Gemini Deep Think 模型,在竞赛限定的 4.5 小时内,直接用英语读题和生成证明,完美解决了 6 道难...
2025突破性进展:DeepSeek-Prover-V2开启AI数学推理新纪元-CSDN博客
DeepSeek-Prover-V2于2025年4月30日正式开源,以6710亿参数规模成为当前最强数学定理证明模型,在MiniF2F测试集实现88.9%通过率,首次让AI具备解决高中数学竞赛级问题的能力。 行业现状:AI数学推理的「形式化鸿沟」 当前大语言模型虽能处理基础数学计算,但在严格逻辑推理领域仍面临重大挑战。自然语言的模糊性与形式化证明...
6710亿参数巨兽降临!DeepSeek开源数学推理大模型,让AI成数学家
4月30日深夜,中国AI公司深度求索(DeepSeek)在Hugging Face开源社区投下一枚核弹:一个拥有6710亿参数的数学大模型DeepSeek-Prover-V2。 这个数字相当于人类大脑860亿神经元的7.8倍,仅训练消耗的算力就相当于1200块顶级A100显卡连续工作3年。当测试人员输入一道国际数学奥林匹克(IMO)级别的几何证明题时,DeepSee...
美国奥数题撕碎AI神话:顶级模型集体翻车,DeepSeek成唯一亮点
依靠自动评分验证不可靠:当尝试通过AI模型为答案打分时,模型自身甚至会认可完全错误的证明,这再次提醒我们——数学证明需要“人性化思维”,而当前的人工智能技术仍存在不可替代的鸿沟。DeepSeek的“逆袭”:唯一的闪光点 在所有参与测试的模型中,开源模型DeepSeek-R1表现最为亮眼,特别是在问题4的测试中几乎接近...
...数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭 - 知乎
最高得分5%,DeepSeek唯一逆袭 编辑:KingHZ Aeneas 【新智元导读】在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。 3月26号,ETH等团队的一项研究一经发布,就引起了圈内热议。
DeepSeek上新首个奥数金牌水平模型丨视讯速递-钛媒体官方网站
DeepSeek上新首个奥数金牌水平模型 9698篇资讯 8.5万关注 视讯速递 关注 新知 科技 商业 财经 最近资讯 DeepSeek上新首个奥数金牌水平模型丨视讯速递 破产重整两年 威马汽车2亿成立新公司“智马行”丨视讯速递 陈天桥提出“发现式智能”,重新定义AGI的意义丨视点Vol.43 ...
谷歌DeepMind Gemini新模型拿下IMO国际数学奥赛【金牌】,谷歌有王者风...
编辑:编辑部 【新智元导读】就在刚刚,谷歌DeepMind最新的数学模型捧得了IMO奥数银牌!它不仅以满分成绩做出了6道题中的4道,距离金牌只有1分之差,而且在第4题上只用了19秒,解题质量和速… 新智元 首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath 机器之心报道, 编辑:小舟、陈陈。几天前,随着榜...