Grok 4进决赛，大模型对抗赛Gemini全军覆没，马斯克「装」起来了

...Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

谁也没想到，谷歌攒的 Kaggle AI Chess 比赛（即大模型国际象棋对抗赛），在半决赛中，Grok 4 击败 Gemini 2.5 Pro，进入总决赛！在昨天的比赛中，Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和

Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。今天的战况依旧让...

您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装...

谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。今天的战况依旧让...

Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了|...

谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。今天的战况依旧让...

Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

谁也没想到,谷歌攒的Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。

Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。

刚刚,马斯克Grok4干翻谷歌Gemini!o3杀入首届大模型对抗赛决战 - 知乎

o3轻而易举击败o4-mini,拿下100%胜率。Grok 4和Gemini 2.5 Pro激烈对决,最终在加赛中Grok 4成功晋级。明日,Grok 4和o3将迎来终局之战。首届大模型国际象棋对抗赛,第二轮战报出炉了! Kaggle Game Arena上,谷歌举办的AI国际象棋表演赛中,Grok 4和o3顺利挺进半决赛:...

AI国际象棋大赛火热开战!Grok 4一骑绝尘,DeepSeek与 Kimi K2的冤屈

近日，谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事备受瞩目。在这一场 “智力的较量” 中，马斯克旗下的 Grok4展现了非凡的实力，成为首日比赛的绝对焦点。这场比赛聚集了多款顶尖 AI 模型，参赛选手包括 OpenAI 的 o3和 o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash、Claude ...

Grok 4号称全球最强AI?似曾相识的“马斯克式吹牛”

尽管比原定发布会时间推迟了近一个小时，但在今天中午（北京时间 9 月 10 日），xAI 创始人马斯克还是发布了新一代大模型 Grok 4。纸面上，Grok 4 已经全面超越了所有竞争对手，包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型，不管是传统的基准测试，还是 SAT 考试（美国高考）以及各个...

战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2...

最新战报最新战报：首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。是的，谷歌给大模型整了个国际象棋比赛：Kaggle AI象棋竞赛。在首日对决之后，参赛选手中OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4都有了第一轮较量，结果——Grok 4...

爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭...

闭源的大模型:Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash; 开源的大模型:DeepSeek R1和Kimi K2 Instruct。首战落幕今日凌晨1点,这场大赛正式打响了8进4淘汰战: Gemini 2.5 Pro、o4-mini、Grok 4、和o3,以4-0的碾

马斯克发布 Grok 4,大模型竞争进入新阶段,AI 格局将彻底改变?

Grok- 4表现出色，源于第一性原理推理在大模型中的应用，也就是将复杂的问题拆解成基础问题去分析。2.全模态融合还能实时进化 Grok 4 能玩转文本、图像、视频和音频的多模态交互，在医疗影像分析上面的准确率更是达到了82%，明显高于GPT-4 的75%。虽然在图像识别方面还有些弱，但是马斯克表示这个拥有10万亿参数...

战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2...

最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。是的,谷歌给大模型整了个国际象棋比赛:Kaggle AI象棋竞赛。在首日对决之后,参赛选手中OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4都有了第一轮较量,结果—— ...

闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了_-mini...

刚刚,我们拿到了第一轮比赛的结果:Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。以下是模型对阵图。这个比赛是在一个名叫「Kaggle Game Arena」的平台上进行的。这是 Kaggle 公司的一个新项目,旨在跳出平时的...

战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2...

最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。是的,谷歌给大模型整了个国际象棋比赛:Kaggle AI象棋竞赛。在首日对决之后,参赛选手中OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4都有了第一轮较量,结果—— ...

爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭...

闭源的大模型:Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash; 开源的大模型:DeepSeek R1和Kimi K2 Instruct。首战落幕今日凌晨1点,这场大赛正式打响了8进4淘汰战: Gemini 2.5 Pro、o4-mini、Grok 4、和o3,以4-0的碾压式战绩横扫对手,进入半决赛。而Claude 4...

年费超 2 万!马斯克刚刚发布最贵 AI,Grok 4 号称所有领域碾压博士

Humanity’s Last Exam（人类最后的考试，简称：HLE，）覆盖了数学、物理、计算机、医学、人文社科等超过 100 个学科，共 2500 道闭卷题，测试难度极高，能够真实反映模型在通用知识和复杂推理上的综合表现。根据 xAI 数据，Grok 4 在不使用任何工具的情况下，得分为 25.4%，超过了 Google Gemini 2.5 Pro 的 ...

闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了

刚刚，我们拿到了第一轮比赛的结果：Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2，晋级半决赛。以下是模型对阵图。这个比赛是在一个名叫「Kaggle Game Arena」的平台上进行的。这是 Kaggle 公司的一个新项目，旨在跳出...

马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分

全世界屏息以待1个小时，马斯克的“世界最强”Grok 4终于发布！一出手，就在“人类最后考试”上，成为首个突破50%准确率的模型。得益于在训练中原生融入工具，Grok-4找到刷分法门，Grok-4 Heavy达到44.4%，比Gemini-2.5-Pro直接提升将近18个百分点。如果测试时训练+融入工具，可直接打到50.7%。马斯克给了个...

突发!马斯克Grok4发布,全部刷新SOTA,硬刚Gemini 2.5 Pro、Claude Opu...

马斯克最新发布的Grok4模型再次证明了华人在AI领域的核心地位。从亚洲金融分享的团队合影可以看出,整个研发团队几乎被华人"包场"——除了寥寥几位白人外,绝大多数都是来自中国的顶尖人才。全球AI竞赛中,华人正在成为不可或缺的主力军。无论是OpenAI、谷歌,还是马斯克的xAI,核心技术团队都离不开华人科学家的贡献。他们...