...Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛!在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和
Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。 今天的战况依旧让...
您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装...
谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。 今天的战况依旧让...
Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了|...
谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。 今天的战况依旧让...
Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
谁也没想到,谷歌攒的Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。
Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。
刚刚,马斯克Grok4干翻谷歌Gemini!o3杀入首届大模型对抗赛决战 - 知乎
o3轻而易举击败o4-mini,拿下100%胜率。Grok 4和Gemini 2.5 Pro激烈对决,最终在加赛中Grok 4成功晋级。明日,Grok 4和o3将迎来终局之战。 首届大模型国际象棋对抗赛,第二轮战报出炉了! Kaggle Game Arena上,谷歌举办的AI国际象棋表演赛中,Grok 4和o3顺利挺进半决赛:...
AI国际象棋大赛火热开战!Grok 4一骑绝尘,DeepSeek与 Kimi K2的冤屈
近日,谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事备受瞩目。在这一场 “智力的较量” 中,马斯克旗下的 Grok4展现了非凡的实力,成为首日比赛的绝对焦点。这场比赛聚集了多款顶尖 AI 模型,参赛选手包括 OpenAI 的 o3和 o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash、Claude ...
Grok 4号称全球最强AI?似曾相识的“马斯克式吹牛”
尽管比原定发布会时间推迟了近一个小时,但在今天中午(北京时间 9 月 10 日),xAI 创始人马斯克还是发布了新一代大模型 Grok 4。纸面上,Grok 4 已经全面超越了所有竞争对手,包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型,不管是传统的基准测试,还是 SAT 考试(美国高考)以及各个...
战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2...
最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。是的,谷歌给大模型整了个国际象棋比赛:Kaggle AI象棋竞赛。在首日对决之后,参赛选手中OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4都有了第一轮较量,结果——Grok 4...
爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭...
闭源的大模型:Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash; 开源的大模型:DeepSeek R1和Kimi K2 Instruct。 首战落幕 今日凌晨1点,这场大赛正式打响了8进4淘汰战: Gemini 2.5 Pro、o4-mini、Grok 4、和o3,以4-0的碾
马斯克发布 Grok 4,大模型竞争进入新阶段,AI 格局将彻底改变?
Grok- 4表现出色,源于第一性原理推理在大模型中的应用,也就是将复杂的问题拆解成基础问题去分析。2.全模态融合还能实时进化 Grok 4 能玩转文本、图像、视频和音频的多模态交互,在医疗影像分析上面的准确率更是达到了82%,明显高于GPT-4 的75%。虽然在图像识别方面还有些弱,但是马斯克表示这个拥有10万亿参数...
战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2...
最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。 是的,谷歌给大模型整了个国际象棋比赛:Kaggle AI象棋竞赛。 在首日对决之后,参赛选手中OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4都有了第一轮较量,结果—— ...
闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了_-mini...
刚刚,我们拿到了第一轮比赛的结果:Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。 以下是模型对阵图。 这个比赛是在一个名叫「Kaggle Game Arena」的平台上进行的。这是 Kaggle 公司的一个新项目,旨在跳出平时的...
战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2...
最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。 是的,谷歌给大模型整了个国际象棋比赛:Kaggle AI象棋竞赛。 在首日对决之后,参赛选手中OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4都有了第一轮较量,结果—— ...
爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭...
闭源的大模型:Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash; 开源的大模型:DeepSeek R1和Kimi K2 Instruct。 首战落幕 今日凌晨1点,这场大赛正式打响了8进4淘汰战: Gemini 2.5 Pro、o4-mini、Grok 4、和o3,以4-0的碾压式战绩横扫对手,进入半决赛。 而Claude 4...
年费超 2 万!马斯克刚刚发布最贵 AI,Grok 4 号称所有领域碾压博士
Humanity’s Last Exam(人类最后的考试,简称:HLE,)覆盖了数学、物理、计算机、医学、人文社科等超过 100 个学科,共 2500 道闭卷题,测试难度极高,能够真实反映模型在通用知识和复杂推理上的综合表现。根据 xAI 数据,Grok 4 在不使用任何工具的情况下,得分为 25.4%,超过了 Google Gemini 2.5 Pro 的 ...
闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了
刚刚,我们拿到了第一轮比赛的结果:Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。以下是模型对阵图。这个比赛是在一个名叫「Kaggle Game Arena」的平台上进行的。这是 Kaggle 公司的一个新项目,旨在跳出...
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
全世界屏息以待1个小时,马斯克的“世界最强”Grok 4终于发布!一出手,就在“人类最后考试”上,成为首个突破50%准确率的模型。得益于在训练中原生融入工具,Grok-4找到刷分法门,Grok-4 Heavy达到44.4%,比Gemini-2.5-Pro直接提升将近18个百分点。如果测试时训练+融入工具,可直接打到50.7%。马斯克给了个...
突发!马斯克Grok4发布,全部刷新SOTA,硬刚Gemini 2.5 Pro、Claude Opu...
马斯克最新发布的Grok4模型再次证明了华人在AI领域的核心地位。从亚洲金融分享的团队合影可以看出,整个研发团队几乎被华人"包场"——除了寥寥几位白人外,绝大多数都是来自中国的顶尖人才。 全球AI竞赛中,华人正在成为不可或缺的主力军。无论是OpenAI、谷歌,还是马斯克的xAI,核心技术团队都离不开华人科学家的贡献。他们...