马斯克吹牛了吗？Grok 4第一波实测：能完虐o3，也菜到数不清手指

马斯克吹牛了吗?Grok 4第一波实测:能完虐o3,也菜到数不清手指

有意思的是，看完网友放出的 Grok 4 吊打 o3 的测评，马斯克反倒谦虚起来，回了句「相当不错，但仍有改进空间」。更有网友调侃称，Grok 4 之所以能够大力出奇迹，离不开无尽的算力、华人和加班。参考链接：https://x.com/alex_prompter/status/1943231978779877514 https://x.com/

马斯克吹牛了吗?Grok 4第一波实测:能完虐o3。也菜到数不清手指

Grok 4 大战 o3博主 @Alex Prompter 对比 Grok 4 和 OpenAI o3 进行了一系列。改写后机器之心的报道来了，部网友们花了不少钱体验了Grok 4。昨天马斯克在发布会上亮相，自豪地说Grok现在各种学科都能达到高级水平，甚至都能搞出科学新发现了！这话一出口，全球网友都沸腾了，虽然Grok 4价格不低，但很多人还...

马斯克吹牛了吗?Grok 4第一波实测:能完虐o3,也菜到数不清手指

昨天,马斯克亮相,一脸骄傲地表示:Grok 现在所有学科都达到博士后水平,没有例外,甚至可以在今年内实现科学新发现。这一下子激起全球网友的兴趣,即使 Grok 4 的价格不菲,不少网友还是自愿氪金去体验一把。 Grok 4 大战 o3 博主@Alex Prompter 对比 Grok 4 和 OpenAI o3 进行了一系列测试。原帖地址:https://x...

看看测试马斯克吹牛了吗?Grok 4第一波... 来自龙奔 - 微博

看看测试。『马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指』https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650979346&idx=1&sn=1cdb742adc3d06f357d2a477a30a7b94&chksm=85504ed5c6413e0f9d0b5129e549090d8fa73eee6a169597c93daea283e19472ceb3c444cb5d&xtrack...

Grok4技术测评:数不清6根手指的博士级AI,暴露了大模型哪些缺陷...

当马斯克在直播中宣称Grok 4"所有学科超博士水平"时,科技圈沸腾了。但短短24小时后,网友实测却让这场狂欢变成了荒诞剧:这个能解黎曼猜想的"超级大脑",居然连人类幼童都能完成的手指计数都频频出错。这种"能解微积分却数不清6"的魔幻现实,撕开了当前AI进化最尴尬的伤疤。

网友实测Grok 4,8:2虐惨GPT-o3,但菜到数不清6根手指\n昨天Grok 4...

网友实测Grok 4,8:2虐惨GPT-o3,但菜到数不清6根手指\n昨天Grok 4刚发布,网友们就带着实测来了,还有拿它和GPT-o3做对比的。看完之后,网友用一句话总结:上限很高,下限也很低。不过,这些结果不一定真的代表它们的实力,大家怎么看这场比拼呢?#实测#大模型#马斯克#Grok4#Grok#XAI#GPT-o3#AI#人工智能#科技...

马斯克吹牛了吗?Grok 4第一波实测-网易公开课

马斯克吹牛了吗?Grok 4第一波实测集数:1 相关推荐 00:27 :我问了马斯克一个问题,你是什么时... 980播放 00:19 马斯克被问AI有什么用: 将全面替... 1608播放 00:21 马斯克:弱者才需要专利,特斯拉的专... 854播放 00:15 马斯克老妈:我72岁都不焦虑,你们... 1235播放 00:17 马斯克睡觉时间...

Grok 4号称全球最强AI?似曾相识的“马斯克式吹牛”

尽管比原定发布会时间推迟了近一个小时，但在今天中午（北京时间 9 月 10 日），xAI 创始人马斯克还是发布了新一代大模型 Grok 4。纸面上，Grok 4 已经全面超越了所有竞争对手，包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型，不管是传统的基准测试，还是 SAT 考试（美国高考）以及各个...

马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6...

马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指 Source link

马斯克最贵AI首批实测,Grok4一边封神一边翻车

接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的Grok 4来说,马斯克放话“这是地球上最聪明的AI”,还没上线,就已经把话题度拉满了。不过,Grok模型向来都是跑分没输过,体验没赢过。如今,距离Grok 4的发布已经过去24小时,我们也搜集了网友分享的一些实测案例,让我们来一起看看这款模型究竟...

马斯克最贵 AI 首批实测炸了,Grok 4 一边封神一边翻车,网友:2 万...

接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的 Grok 4 来说,马斯克放话「这是地球上最聪明的 AI」,还没上线,就已经把话题度拉满了。不过, Grok 模型向来都是跑分没输过,体验没赢过。如今,距离 Grok 4 的发布已经过去 24 小时,我们也搜集了网友分享的一些实测案例 ,让我们来一起看看这...

马斯克发布Grok4:比OpenAI便宜?学术问题堪比博士级别

适合五分钟写PPT大纲或改简历。高级玩家请切换Grok4Heavy版本。它的核心是四大脑联动。当输入粒子物理实验论文时。第一个AI拆解数学公式。第二个核对实验数据偏差值，第三个检查参考文献可信度。最后整合报告时标出8处数据矛盾点，学术圈已经疯了。斯坦福生物组学生现场实测。上传300页阿尔茨海默症论文PDF。指令"用高中...

机器之心Pro的个人主页

马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指 )对比以上两个提示词可以发现,问题就出在提示词给出的任务难度上,前一个提示词(HTML/JS)要求模型从零开始发明和实现一个物理引擎,后一个提示词(Python)允许模型使用现成的、成熟的物理引擎库。当然数手… ...

马斯克最贵AI 首批实测炸了,Grok4一边封神一边翻车,网友:2万块就这?

当被要求将一幅被拆分为三张小图的线条漫画,完整还原为纯SVG时,Grok 4表现拔尖,人物动作自然,而o3虽然也想拼全图,但页面排版混乱,出现文字穿模、对白重叠等问题。【重构专辑封面】第三关是让模型画出Radiohead的《In Rainbows》封面。OpenAI o3是唯一一个在排版和结构上高度还原的模型,展现出强大的记忆与设计...

马斯克最贵AI首批实测,Grok4一边封神一边翻车

接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的Grok 4来说,马斯克放话“这是地球上最聪明的AI”,还没上线,就已经把话题度拉满了。不过,Grok模型向来都是跑分没输过,体验没赢过。如今,距离Grok 4的发布已经过去24小时,我们也搜集了网友分享的一些实测案例,让我们来一起看看这款模型究竟...

马斯克最贵 AI 首批实测炸了,Grok 4 一边封神一边翻车,网友:2 万...

接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的 Grok 4 来说,马斯克放话「这是地球上最聪明的 AI」,还没上线,就已经把话题度拉满了。不过, Grok 模型向来都是跑分没输过,体验没赢过。如今,距离 Grok 4 的发布已经过去 24 小时,我们也搜集了网友分享的一些实测案例 ,让我们来一...

马斯克最贵 AI 首批实测炸了,Grok 4 一边封神一边翻车,网友:2 万...

接连数月,模型一个接一个轮番登场,一个比一个自称炸裂。就拿昨天的 Grok 4 来说,马斯克放话「这是地球上最聪明的 AI」,还没上线,就已经把话题度拉满了。不过, Grok 模型向来都是跑分没输过,体验没赢过。如今,距离 Grok 4 的发布已经过去 24 小时,我们也搜集了网友分享的一些实测案例 ,让我们来一...

Grok 4号称“全球最强AI”?其实是马斯克的自吹自擂-36氪

Grok已麻烦缠身。「这是世界上最聪明的人工智能。」尽管比原定发布会时间推迟了近一个小时,但在今天中午(北京时间 9 月 10 日),xAI 创始人马斯克还是发布了新一代大模型 Grok 4。纸面上,Grok 4 已经全面超越了所有竞争对手,包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型,不管是传...

马斯克天价AI实测:Grok 4封神编程却败走物理模拟

当马斯克在直播中宣布Grok 4"比所有学科博士都聪明"时，科技圈瞬间炸开了锅。这款月费2153元的AI，顶着"人类最后考试"榜首的光环登场，却在首批用户实测中上演了冰火两重天——程序员们为它严谨的代码欢呼，物理模拟测试却让它狼狈翻车。天价订阅背后的学霸人设 xAI这次祭出的SuperGrokHeavy套餐堪称AI界的爱马仕，...

Grok 4号称全球最强AI?似曾相识的“马斯克式吹牛” - 知乎

似曾相识的“马斯克式吹牛” 「这是世界上最聪明的人工智能。」尽管比原定发布会时间推迟了近一个小时,但在今天中午(北京时间 9 月 10 日),xAI 创始人马斯克还是发布了新一代大模型 Grok 4。纸面上,Grok 4 已经全面超越了所有竞争对手,包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型...